+982184977834
Today
2018-12-14   |   فارسی
Laboratory Activities

دادگان

به منظور بهره‏‌مندی عموم جامعه ذینفعان، بخشی از دادگان محک توسعه داده شده در آزمایشگاه، که به منظور ارزیابی خدمات مختلف تحت وب مورد استفاده قرار می‏‌گیرند، در این قسمت به اشتراک‏‌گذاری شده‏ اند. مجموعه دادگانی که در حال حاضر در اختیار قرار گرفته‌‏اند عبارتند از:

  • مجموعه پرس‌‏وجوها: این پرس‏‌وجوها، که به تفکیک نوع جویشگر (متنی، تصویری، صوتی و ویدئویی) ارائه شده‏‌اند، برای ارزیابی‏‌های خودکار و انسانی جویشگرهای مختلف مورد استفاده قرار می‏‌گیرند. هر آیتم در این مجموعه یک پرس و جو را نشان می‏دهد که برچسب‏های مختلفی، نظیر دسته‌‏بندی (علوم، کامپیوتر، هنر و سرگرمی و…)، نوع (پیمایشی یا اطلاعاتی)، زبان (فارسی، انگلیسی،…)، منبع دریافت (کاربران، لاگ جویشگرها،…) و تعداد کلمات روی آن خورده است. برای برخی از پرس‏‌وجوها، نظیر پرس و جوهای جویشگرهای صوتی، با توجه به آنکه نوع پرس و جوها پیمایشی بوده است، فایل صوتی متناظر، که انتظار می‏رود جویشگر صوتی آن را بازگرداند، نیز در مجموعه دادگان ضمیمه شده است.
  • پیکره ترجمه: جملات موجود در این پیکره، برای ارزیابی خودکار و انسانی مترجم‏‌های ماشینی مختلف مورد استفاده قرار می‏‌گیرند. هر آیتم در این پیکره شامل یک جمله انگلیسی و ۴ ترجمه مختلف از آن به زبان فارسی است. ترجمه‏‌های موجود در پیکره توسط انسان و با کیفیت طلایی تولید شده‌‏اند و لذا از دقت بالایی برخوردار هستند. هرچه خروجی یک ماشین ترجمه به این ترجمه‏‌ها نزدیک‏تر باشد، نشان‏‌دهنده کیفیت بالاتر آن ماشین ترجمه خواهد بود.

 

ردیف نمونه دادگان، جهت ارزیابی خدمات ذیل فایل
۱ جویشگر متن دانلود فایل
۲ جویشگر صوت دانلود فایل
۳ جویشگر تصویر دانلود فایل
۴ جویشگر ویدیو دانلود فایل
۵ ترجمه ماشینی دانلود فایل