این کار همچنین میتواند به پیشرفت فناوریهای دیگر کمک کند، مانند ساخت دستیارهایی که به خوبی به زبانهایی مانند جاوه و ازبکی کار میکنند، یا ایجاد سیستمهایی برای گرفتن فیلمهای بالیوود و اضافه کردن زیرنویسهای دقیق به زبان سواحیلی یا اورومو.
بیشتر بدانید کار ما برای ساخت NLLB-200، که کمک می کند متاورس برای افراد بیشتری در سراسر جهان قابل دسترسی باشد.
منبع

محققان هوش مصنوعی ما برای کمک به مردم برای برقراری ارتباط بهتر امروز و تبدیل شدن به بخشی از متاواژه فردا هیچ زبانی باقی نمانده است (NLLB)، تلاشی برای توسعه قابلیت های ترجمه ماشینی با کیفیت بالا برای اکثر زبان های دنیا. امروز، پیشرفت مهمی را در NLLB اعلام میکنیم: ما یک مدل هوش مصنوعی به نام NLLB-200 ساختهایم که 200 زبان مختلف را با نتایج بسیار دقیقتر از آنچه فناوری قبلی میتوانست انجام دهد، ترجمه میکند.
و برای کمک به سایر محققان برای بهبود ابزارهای ترجمه خود و توسعه کار خود، مدلهای NLLB-200 و مجموعه داده FLORES-200 را به توسعهدهندگان باز میکنیم، علاوه بر کد آموزشی مدل و کد برای ایجاد مجدد مجموعه داده آموزشی.
برای ارزیابی و بهبود NLLB-200، ما ساختیم FLORES-200، مجموعه داده ای که محققان را قادر می سازد عملکرد این مدل هوش مصنوعی را در 40000 جهت زبان مختلف ارزیابی کنند. FLORES-200 به ما امکان می دهد عملکرد NLLB-200 را در هر زبان اندازه گیری کنیم تا تأیید کنیم که ترجمه ها با کیفیت هستند.
هنگام مقایسه کیفیت ترجمه ها با تحقیقات قبلی هوش مصنوعی، NLLB-200 به طور متوسط 44 درصد امتیاز بالاتری کسب کرد. برای برخی از زبانهای آفریقایی و هندی، ترجمههای NLLB-200 بیش از 70 درصد دقیقتر بودند.
تعداد انگشت شماری از زبان ها – از جمله انگلیسی، ماندارین، اسپانیایی و عربی – بر وب مسلط هستند. گویشوران بومی این زبانهای پرمخاطب ممکن است اهمیت خواندن چیزی به زبان مادری خود را بدیهی بدانند. NLLB به افراد بیشتری کمک می کند تا مطالب را به زبان دلخواه خود بخوانند، نه اینکه همیشه به زبان واسطه ای نیاز داشته باشند که اغلب احساسات یا محتوا را اشتباه می گیرد.
ما همچنین تا 200,000 دلار کمک مالی برای استفاده موثر از NLLB-200 به محققان و سازمان های غیرانتفاعی با ابتکارات اعطا می کنیم. تمرکز بر پایداری، امنیت غذایی، خشونت مبتنی بر جنسیت، آموزش یا سایر زمینه ها در حمایت از اهداف توسعه پایدار سازمان ملل. سازمانهای غیرانتفاعی علاقهمند به استفاده از NLLB-200 برای ترجمه دو یا چند زبان آفریقایی، و همچنین محققانی که در زبان شناسی، ترجمه ماشینی و فناوری زبان، دعوت به درخواست می شوند.
این پیشرفتهای تحقیقاتی از بیش از 25 میلیارد ترجمه هر روز در فید فیسبوک، اینستاگرام و سایر فناوریهای ما پشتیبانی میکند. تو می توانی نسخه ی نمایشی NLLB-200 را کاوش کنید و عمیق تر به چگونگی توسعه این مدل نگاه کنید.
ترجمه گسترده و گنجاندن بیشتر
زبان راه نجات ما برای جهان است. اما از آنجایی که ابزارهای ترجمه با کیفیت بالا برای صدها زبان وجود ندارد، امروزه میلیاردها نفر نمی توانند به محتوای دیجیتال دسترسی داشته باشند یا به طور کامل در مکالمات و جوامع آنلاین به زبان های دلخواه یا بومی خود شرکت کنند. این مسئله مخصوصاً برای صدها میلیون نفر که به بسیاری از زبانهای آفریقا و آسیا صحبت میکنند، اهمیت دارد.
با شروع شکلگیری متاورس، توانایی ساخت فنآوریهایی که در گستره وسیعتری از زبانها به خوبی کار میکنند، به دموکراتیک کردن دسترسی به تجربیات همهجانبه در جهانهای مجازی کمک میکند.