DINOv2 می تواند اشیاء را در یک تصویر یا یک ویدیو بدون نظارت مطلق و بدون تعیین هدف هدفمند کشف و بخش بندی کند. به عنوان مثال، DINO می تواند بفهمد که یک تصویر حاوی نمایشی از یک سگ است بدون اینکه در وهله اول به او آموزش داده شود که سگ چیست. به عنوان بخشی از این اطلاعیه، ما یک را به اشتراک گذاشتیم نسخه ی نمایشی عمومی که هر کسی می تواند از آن برای کشف برخی از قابلیت های DINOv2 استفاده کند.
برای آخرین پیشرفت خود، SEER10B، ما از مجموعه داده های متنوعی استفاده می کنیم تا دید کامپیوتری بهتر و منصفانه تری را ایجاد کنیم. سیستمهای بینایی رایانهای سنتی عمدتاً بر روی نمونههایی از ایالات متحده و کشورهای ثروتمند در اروپا آموزش داده میشوند، بنابراین اغلب برای تصاویر مکانهای دیگر با ویژگیهای اجتماعی-اقتصادی متفاوت به خوبی کار نمیکنند. SEER نتایج قوی را برای تصاویر از سراسر جهان – از جمله مناطق غیر آمریکایی و غیر اروپایی با طیف گسترده ای از سطوح درآمد ارائه می دهد. SEER10B عملکرد در معیارهای انصاف را در بین جنسیت، رنگ ظاهری پوست و گروه های سنی به شدت بهبود بخشید. جدا از عملکرد بهبود یافته در معیارهای انصاف، این مدل تصاویر را از سراسر جهان به خوبی درک می کند تا آنها را با دقت بی سابقه ای بومی سازی کند. ما امیدواریم که SEER یک بلوک سازنده مهم باشد زیرا جامعه هوش مصنوعی برای ساختن سیستم هایی کار می کند که برای همه به خوبی کار می کند.
پیشرفت در مدل سازی سه بعدی
ما در حال حاضر از DINOv2 برای کسب اطلاعات بیشتر در مورد دنیای فیزیکی استفاده می کنیم. متا اخیراً با موسسه منابع جهانی به از هوش مصنوعی برای نقشه برداری از جنگل ها استفاده کنید – درخت به درخت – در مناطقی به اندازه قاره ها. در حالی که مدل خود نظارت شده ما بر روی دادههای جنگلها آموزش داده شده بود آمریکای شمالی، ارزیابیها تأیید میکند که به خوبی تعمیم مییابد و نقشههای دقیقی را در مکانهای دیگر در سراسر جهان ارائه میکند.
موری گفت: «تحقیقات ما با ترکیبی منحصربهفرد از جاهطلبی و دانشگاهی هدایت میشود، و تیم ما در سراسر مرزهای تخصص، ارشدیت، مکان و نقش شغلی با هم کار میکند تا پیشرفت سریع تحقیقاتی داشته باشد.» “در این دوره فعلی در تحقیقات هوش مصنوعی، ظاهرا هر روز یک پیشرفت تحقیقاتی جدید بالقوه، از جمله از تیم EMEA ما به ارمغان می آورد.”
تحقیق مدل زبان بزرگ پیشگامانه
در اوایل امسال، محققان ما در پاریس تیمی را تشکیل دادند که ساخت و مستقر شد LLaMA (مدل زبان بزرگ Meta AI) – یک پایه پیشرفته مدل زبان بزرگ طراحی شده برای کمک به محققان در پیشبرد کار خود در این زیر شاخه از هوش مصنوعی.
با هم، ما در حال کار بر روی رابط های هوش مصنوعی متنی هستیم که می تواند به دستگاه های ما اجازه دهد تا زمینه، ترجیحات، تاریخچه و اهداف ما را درک کنند. این از چشم انداز آینده ما پشتیبانی می کند که در آن دستگاه ها به جای ابزار به عنوان شریک عمل می کنند و ما را با فناوری ای احاطه می کنند که با ما سازگار است و به ما کمک می کند تا همانطور که می خواهیم کار کنیم.
تیم پاریس ما، با همکاری همکارانش در آمریکای شمالی، همچنین با استفاده از تحقیقات جدید پیشگام شد SEER (Self-SupERvised)، مدل پیشگامانه بینایی کامپیوتری خود نظارتی تحقیقات متا AI. SEER مستقیماً از هر مجموعه تصادفی تصاویر – بدون نیاز به تنظیم دقیق داده ها و برچسب زدن که به آموزش بینایی رایانه ای مرسوم می رسد – می آموزد و سپس یک جاسازی تصویر را خروجی می دهد.
یکی از مهمترین تصمیمهایی که در زمان راهاندازی FAIR گرفتیم این بود که تحقیقات اکتشافی و علوم باز را در مرکز قرار دهیم. ما به طور منظم با محققان خارجی همکاری می کنیم، زیرا فرضیه قوی داریم که این سریع ترین و مسئول ترین راه برای پیشرفت است.
تیم ما در تلآویو از نزدیک روی هوش مصنوعی مولد کار میکند و در خط مقدم برخی از جدیدترین پیشرفتهای متا بوده است. در ژوئیه 2022، محققان و همکاران تل آویو ما در سراسر جهان ایجاد یک مدل تحقیقاتی مولد هوش مصنوعی به نام Make-A-Scene. این روش هوش مصنوعی مولد چندوجهی، کنترل خلاقانه را در دست افرادی قرار میدهد که از آن استفاده میکنند و به آنها اجازه میدهد دید خود را از طریق توضیحات متنی و طرحهای آزاد توصیف و نشان دهند، و در نتیجه هنر سورئال، مانند پرواز هات داگ در آسمان و آسمانخراشها در بیابان.
در هشت سالی که مرکز نمایشگاه خود را در پاریس تأسیس کردیم، متا به یکی از سازمانهای تحقیقاتی پیشرو در جهان تبدیل شده است، با کارهای پیشگامانهای که از مراکز فناوری ما در پاریس، لندن، تلآویو و زوریخ سرچشمه میگیرد.
موری گفت: «در ماههای اخیر، تلاقی هیجانانگیزی از ادراک چندوجهی، درک و تولید زبان، یادگیری تقویتی، و تعامل انسان و ماشین وجود داشته است. این تلاقی ما را به رویای دیرینه این میدان برای ساختن سیستمهای هوشمند واقعاً پیشرفته نزدیکتر میکند که بسیار هیجانانگیز است.»