حفظ تنوع زبانی جهان از طریق هوش مصنوعی

مدل‌های Massively Multilingual Speech (MMS) فناوری تبدیل متن به گفتار و گفتار به متن را از حدود 100 زبان به بیش از 1100 زبان – بیش از 10 برابر بیشتر از قبل – گسترش می‌دهند و همچنین می‌توانند بیش از 4000 زبان گفتاری را 40 بار شناسایی کنند. بیش از پیش.

بy با توجه به ضبط های بدون برچسب قرائت های مختلف مذهبی مسیحی، افزایش دادیم تعداد زبان های موجود برای بیش از 4000. در حالی که این داده ها از یک دامنه خاص است و اغلب توسط سخنرانان مرد خوانده می شود، تجزیه و تحلیل ما نشان می دهد که مدل های ما برای صدای مردانه و زنانه به یک اندازه خوب اجرا می شود. و در حالی که محتوای ضبط‌های صوتی مذهبی است، تحلیل ما نشان می‌دهد که این مدل را برای تولید زبان مذهبی بیشتر سوگیری نمی‌کند.

پیش رفتن

بسیاری از زبان‌های دنیا در خطر ناپدید شدن هستند و محدودیت‌های تکنولوژی تشخیص گفتار و تولید فعلی تنها این روند را تسریع می‌کند. ما می‌خواهیم دسترسی افراد به اطلاعات و استفاده از دستگاه‌ها به زبان دلخواهشان را آسان‌تر کنیم و امروز مجموعه‌ای از مدل‌های هوش مصنوعی (AI) را معرفی می‌کنیم که می‌تواند به آنها در انجام این کار کمک کند.

همچنین موارد استفاده زیادی برای فناوری گفتار – از فناوری واقعیت مجازی و واقعیت افزوده گرفته تا خدمات پیام‌رسانی – وجود دارد که می‌توانند به زبان دلخواه شخص استفاده شوند و صدای همه را درک کنند.

جمع آوری داده های صوتی برای هزاران زبان اولین چالش ما بود زیرا بزرگترین مجموعه داده گفتاری موجود حداکثر 100 زبان را پوشش می دهد. برای غلبه بر این امر، به متون دینی، مانند کتاب مقدس، که به بسیاری از زبان‌های مختلف ترجمه شده‌اند و ترجمه‌های آن‌ها به‌طور گسترده برای تحقیق ترجمه زبان مبتنی بر متن مورد مطالعه قرار گرفته‌اند، روی آوردیم.

پشتیبانی از هزاران زبان

این ترجمه‌ها دارای ضبط‌های صوتی در دسترس عموم از افرادی هستند که این متون را به زبان‌های مختلف می‌خوانند. به عنوان بخشی از پروژه MMS، مجموعه داده ای از قرائت عهد جدید به بیش از 1100 زبان ایجاد کردیم که به طور متوسط ​​32 ساعت داده در هر زبان ارائه می کرد.

درباره MMS بیشتر بدانید.





منبع

ما مدل‌ها و کدهای خود را منبع باز می‌سازیم تا دیگران در جامعه تحقیقاتی بتوانند بر اساس کار ما کار کنند و به حفظ زبان‌های دنیا و نزدیک‌تر کردن دنیا به یکدیگر کمک کنند.

رویکرد ما

در آینده، ما می‌خواهیم پوشش MMS را افزایش دهیم تا حتی از زبان‌های بیشتری پشتیبانی کند، و همچنین با چالش مدیریت گویش‌ها، که اغلب برای فناوری گفتار موجود دشوار است، مقابله کنیم.