مدل جدید هوش مصنوعی 200 زبان را ترجمه می کند و فناوری را برای افراد بیشتری قابل دسترس می کند

محققان هوش مصنوعی ما برای کمک به مردم برای برقراری ارتباط بهتر امروز و تبدیل شدن به بخشی از متاواژه فردا هیچ زبانی باقی نمانده است (NLLB)، تلاشی برای توسعه قابلیت های ترجمه ماشینی با کیفیت بالا برای اکثر زبان های دنیا. امروز، پیشرفت مهمی را در NLLB اعلام می‌کنیم: ما یک مدل هوش مصنوعی به نام NLLB-200 ساخته‌ایم که 200 زبان مختلف را با نتایج بسیار دقیق‌تر از آنچه فناوری قبلی می‌توانست انجام دهد، ترجمه می‌کند.

زبان راه نجات ما برای جهان است. اما از آنجایی که ابزارهای ترجمه با کیفیت بالا برای صدها زبان وجود ندارد، امروزه میلیاردها نفر نمی توانند به محتوای دیجیتال دسترسی داشته باشند یا به طور کامل در مکالمات و جوامع آنلاین به زبان های دلخواه یا بومی خود شرکت کنند. این مسئله مخصوصاً برای صدها میلیون نفر که به بسیاری از زبان‌های آفریقا و آسیا صحبت می‌کنند، اهمیت دارد.

تعداد انگشت شماری از زبان ها – از جمله انگلیسی، ماندارین، اسپانیایی و عربی – بر وب مسلط هستند. گویشوران بومی این زبان‌های پرمخاطب ممکن است اهمیت خواندن چیزی به زبان مادری خود را بدیهی بدانند. NLLB به افراد بیشتری کمک می کند تا مطالب را به زبان دلخواه خود بخوانند، نه اینکه همیشه به زبان واسطه ای نیاز داشته باشند که اغلب احساسات یا محتوا را اشتباه می گیرد.

این کار همچنین می‌تواند به پیشرفت فناوری‌های دیگر کمک کند، مانند ساخت دستیارهایی که به خوبی به زبان‌هایی مانند جاوه و ازبکی کار می‌کنند، یا ایجاد سیستم‌هایی برای گرفتن فیلم‌های بالیوود و اضافه کردن زیرنویس‌های دقیق به زبان سواحیلی یا اورومو.

برای ارزیابی و بهبود NLLB-200، ما ساختیم FLORES-200، مجموعه داده ای که محققان را قادر می سازد عملکرد این مدل هوش مصنوعی را در 40000 جهت زبان مختلف ارزیابی کنند. FLORES-200 به ما امکان می دهد عملکرد NLLB-200 را در هر زبان اندازه گیری کنیم تا تأیید کنیم که ترجمه ها با کیفیت هستند.

با شروع شکل‌گیری متاورس، توانایی ساخت فن‌آوری‌هایی که در گستره وسیع‌تری از زبان‌ها به خوبی کار می‌کنند، به دموکراتیک کردن دسترسی به تجربیات همهجانبه در جهان‌های مجازی کمک می‌کند.

هنگام مقایسه کیفیت ترجمه ها با تحقیقات قبلی هوش مصنوعی، NLLB-200 به طور متوسط ​​44 درصد امتیاز بالاتری کسب کرد. برای برخی از زبان‌های آفریقایی و هندی، ترجمه‌های NLLB-200 بیش از 70 درصد دقیق‌تر بودند.

بیشتر بدانید کار ما برای ساخت NLLB-200، که کمک می کند متاورس برای افراد بیشتری در سراسر جهان قابل دسترسی باشد.





منبع

و برای کمک به سایر محققان برای بهبود ابزارهای ترجمه خود و توسعه کار خود، مدل‌های NLLB-200 و مجموعه داده FLORES-200 را به توسعه‌دهندگان باز می‌کنیم، علاوه بر کد آموزشی مدل و کد برای ایجاد مجدد مجموعه داده آموزشی.

این پیشرفت‌های تحقیقاتی از بیش از 25 میلیارد ترجمه هر روز در فید فیس‌بوک، اینستاگرام و سایر فناوری‌های ما پشتیبانی می‌کند. تو می توانی نسخه ی نمایشی NLLB-200 را کاوش کنید و عمیق تر به چگونگی توسعه این مدل نگاه کنید.

ترجمه گسترده و گنجاندن بیشتر

یک گرافیک گویا نشان می دهد که چگونه می توان از مدل ترجمه جدید هوش مصنوعی متا به طرق مختلف استفاده کرد.

ما همچنین تا 200,000 دلار کمک مالی برای استفاده موثر از NLLB-200 به محققان و سازمان های غیرانتفاعی با ابتکارات اعطا می کنیم. تمرکز بر پایداری، امنیت غذایی، خشونت مبتنی بر جنسیت، آموزش یا سایر زمینه ها در حمایت از اهداف توسعه پایدار سازمان ملل. سازمان‌های غیرانتفاعی علاقه‌مند به استفاده از NLLB-200 برای ترجمه دو یا چند زبان آفریقایی، و همچنین محققانی که در زبان شناسی، ترجمه ماشینی و فناوری زبان، دعوت به درخواست می شوند.