در مقایسه با نسخه های قبلی خود، متوجه شدیم که BlenderBot 3 31٪ در کارهای مکالمه بهبود یافته است. همچنین دو برابر دانش است، در حالی که از نظر واقعی نادرست است 47٪ کمتر. ما همچنین دریافتیم که تنها 0.16٪ از پاسخ های BlenderBot به مردم به عنوان بی ادبانه یا نامناسب علامت گذاری شده است.
پیشرفت در زمینه هوش مصنوعی به شدت به فرصتی برای جامعه تحقیقاتی گستردهتر هوش مصنوعی برای ایجاد بهترین فناوری موجود بستگی دارد. بنابراین، انتشار مدلها و مجموعه دادههای ربات چت برای به دست آوردن بینش کامل و قابل اعتماد در مورد چگونگی و چرایی کار، پتانسیل و محدودیتهایشان کلیدی است.
برای بهبود توانایی BlenderBot 3 در تعامل با مردم، آن را با مقدار زیادی از دادههای زبان عمومی در دسترس آموزش دادیم. بسیاری از مجموعه دادههای مورد استفاده توسط تیم خودمان جمعآوری شدهاند، از جمله یک مجموعه داده جدید شامل بیش از 20000 مکالمه با افرادی که بیش از 1000 موضوع گفتگو دارند. ما BlenderBot 3 را آموزش دادیم تا از مکالمات بیاموزد تا مهارتهایی را که مردم از همه مهمتر میدانند بهبود بخشد – از صحبت کردن در مورد دستور العملهای سالم تا یافتن امکانات مناسب برای کودکان در شهر.
در حالی که BlenderBot 3 به طور قابل توجهی چت ربات های در دسترس عموم را پیشرفت می دهد، مطمئناً در سطح انسانی نیست. گاهی اوقات نادرست، ناسازگار و خارج از موضوع است. همانطور که افراد بیشتری با نسخه نمایشی ما تعامل دارند، مدلهای خود را با استفاده از بازخورد و انتشار دادههای آنها بهبود میبخشیم تا به نفع جامعه گستردهتر هوش مصنوعی باشد.
هدف تحقیق ما جمع آوری و انتشار داده های بازخوردی است که ما و جامعه تحقیقاتی گسترده تر هوش مصنوعی می توانیم در طول زمان از آنها استفاده کنیم. به این ترتیب، ما میتوانیم راههای جدیدی برای ایمنتر و جذابتر بودن سیستمهای هوش مصنوعی برای افرادی که از آنها استفاده میکنند، پیدا کنیم.
رانندگی به جلو با هوش مصنوعی محاوره ای
توسعه یک چت بات ایمن که خود را بهبود می بخشد
اجازه دادن به یک سیستم هوش مصنوعی برای تعامل با مردم در دنیای واقعی منجر به مکالمات طولانی تر و متنوع تر و همچنین بازخوردهای متنوع تر می شود. به عنوان مثال، میتوانید به هر پیام چت در نسخه ی نمایشی BlenderBot 3 ما با کلیک کردن روی نمادهای شست بالا یا شست پایین واکنش نشان دهید. انتخاب یک علامت کوچک به شما امکان میدهد توضیح دهید که چرا پیام را دوست نداشتید – خواه این پیام خارج از موضوع، بیمعنا، بیادب، هرزنامه یا چیز دیگری بود. همچنین می توانید بازخورد خود را در چت ارسال کنید.
از آنجایی که همه چتباتهای مکالمه هوش مصنوعی به تقلید و ایجاد اظهارات ناامن، جانبدارانه یا توهینآمیز معروف هستند، ما مطالعات گستردهای را انجام دادهایم، کارگاههای آموزشی را با هم سازماندهی کردهایم و تکنیکهای جدیدی را برای ایجاد محافظهایی برای BlenderBot 3 ایجاد کردهایم. علیرغم این کار، BlenderBot همچنان میتواند نظرات بی ادبانه یا توهین آمیز بدهید، به همین دلیل است که ما در حال جمع آوری بازخوردهایی هستیم که به بهتر شدن چت ربات های آینده کمک می کند.
وعده و چالش چت با انسان ها
برای ساختن سیستمهای هوش مصنوعی (AI) که میتوانند به روشهای هوشمندانهتر، ایمنتر و مفیدتر با مردم تعامل کنند، باید به آنها آموزش دهیم تا با نیازهای ما سازگار شوند. امروز، ما در حال انتشار هستیم BlenderBot 3، کارگزار مکالمه ای پیشرفته ما که می تواند به طور طبیعی با مردم صحبت کند، آنها می توانند در مورد چگونگی بهبود پاسخ های مدل، بازخورد ارائه کنند. ما دادههای حاصل از این تعاملات را به اشتراک خواهیم گذاشت و کارتهای مدل و مدل BlenderBot 3 را با جامعه علمی به اشتراک گذاشتهایم تا به پیشرفت تحقیقات در زمینه هوش مصنوعی محاورهای کمک کنیم.
درباره BlenderBot 3 بیشتر بدانید
هنگامی که پاسخ ربات چت رضایت بخش نیست، ما در مورد آن بازخورد جمع آوری می کنیم. با استفاده از این داده ها می توانیم مدل را به گونه ای بهبود دهیم که اشتباهات خود را تکرار نکند.
ما می دانیم که همه کسانی که از چت بات ها استفاده می کنند نیت خوبی ندارند، بنابراین الگوریتم یادگیری جدیدی را نیز توسعه دادیمس برای تمایز بین پاسخ های مفید و مثال های مضر. با گذشت زمان، ما از این تکنیک استفاده خواهیم کرد تا مدل های خود را برای همه کاربران مسئولیت پذیرتر و ایمن تر کنیم.
قرار دادن BlenderBot 3 برای آزمایش
سری BlenderBot در ترکیب مهارتهای مکالمه – مانند شخصیت، همدلی و دانش – با ترکیب حافظه بلند مدت و جستجو در اینترنت برای انجام مکالمات معنادار پیشرفت کرده است. BlenderBot 3 این مهارت ها را به ارث می برد و عملکردی عالی ارائه می دهد زیرا از هوش مصنوعی متا ساخته شده است که در دسترس عموم قرار دارد. مدل زبان OPT-175B – تقریباً 58 برابر اندازه BlenderBot 2.