BlenderBot 3: یک چت ربات هوش مصنوعی که از طریق مکالمه بهبود می یابد


برای ساختن سیستم‌های هوش مصنوعی (AI) که می‌توانند به روش‌های هوشمندانه‌تر، ایمن‌تر و مفیدتر با مردم تعامل کنند، باید به آن‌ها آموزش دهیم تا با نیازهای ما سازگار شوند. امروز، ما در حال انتشار هستیم BlenderBot 3، کارگزار مکالمه ای پیشرفته ما که می تواند به طور طبیعی با مردم صحبت کند، آنها می توانند در مورد چگونگی بهبود پاسخ های مدل، بازخورد ارائه کنند. ما داده‌های حاصل از این تعاملات را به اشتراک خواهیم گذاشت و کارت‌های مدل و مدل BlenderBot 3 را با جامعه علمی به اشتراک گذاشته‌ایم تا به پیشرفت تحقیقات در زمینه هوش مصنوعی محاوره‌ای کمک کنیم.

سری BlenderBot در ترکیب مهارت‌های مکالمه – مانند شخصیت، همدلی و دانش – با ترکیب حافظه بلند مدت و جستجو در اینترنت برای انجام مکالمات معنادار پیشرفت کرده است. BlenderBot 3 این مهارت ها را به ارث می برد و عملکردی عالی ارائه می دهد زیرا از هوش مصنوعی متا ساخته شده است که در دسترس عموم قرار دارد. مدل زبان OPT-175B – تقریباً 58 برابر اندازه BlenderBot 2.

از آنجایی که همه چت‌بات‌های مکالمه هوش مصنوعی به تقلید و ایجاد اظهارات ناامن، جانبدارانه یا توهین‌آمیز معروف هستند، ما مطالعات گسترده‌ای را انجام داده‌ایم، کارگاه‌های آموزشی را با هم سازماندهی کرده‌ایم و تکنیک‌های جدیدی را برای ایجاد محافظ‌هایی برای BlenderBot 3 ایجاد کرده‌ایم. علی‌رغم این کار، BlenderBot همچنان می‌تواند نظرات بی ادبانه یا توهین آمیز بدهید، به همین دلیل است که ما در حال جمع آوری بازخوردهایی هستیم که به بهتر شدن چت ربات های آینده کمک می کند.

وعده و چالش چت با انسان ها

اجازه دادن به یک سیستم هوش مصنوعی برای تعامل با مردم در دنیای واقعی منجر به مکالمات طولانی تر و متنوع تر و همچنین بازخوردهای متنوع تر می شود. به عنوان مثال، می‌توانید به هر پیام چت در نسخه ی نمایشی BlenderBot 3 ما با کلیک کردن روی نمادهای شست بالا یا شست پایین واکنش نشان دهید. انتخاب یک علامت کوچک به شما امکان می‌دهد توضیح دهید که چرا پیام را دوست نداشتید – خواه این پیام خارج از موضوع، بی‌معنا، بی‌ادب، هرزنامه یا چیز دیگری بود. همچنین می توانید بازخورد خود را در چت ارسال کنید.

اسکرین شات مکالمه با BlenderBot 3 را نشان می دهد.

توسعه یک چت بات ایمن که خود را بهبود می بخشد

برای بهبود توانایی BlenderBot 3 در تعامل با مردم، آن را با مقدار زیادی از داده‌های زبان عمومی در دسترس آموزش دادیم. بسیاری از مجموعه داده‌های مورد استفاده توسط تیم خودمان جمع‌آوری شده‌اند، از جمله یک مجموعه داده جدید شامل بیش از 20000 مکالمه با افرادی که بیش از 1000 موضوع گفتگو دارند. ما BlenderBot 3 را آموزش دادیم تا از مکالمات بیاموزد تا مهارت‌هایی را که مردم از همه مهم‌تر می‌دانند بهبود بخشد – از صحبت کردن در مورد دستور العمل‌های سالم تا یافتن امکانات مناسب برای کودکان در شهر.

هنگامی که پاسخ ربات چت رضایت بخش نیست، ما در مورد آن بازخورد جمع آوری می کنیم. با استفاده از این داده ها می توانیم مدل را به گونه ای بهبود دهیم که اشتباهات خود را تکرار نکند.

ما می دانیم که همه کسانی که از چت بات ها استفاده می کنند نیت خوبی ندارند، بنابراین الگوریتم یادگیری جدیدی را نیز توسعه دادیمس برای تمایز بین پاسخ های مفید و مثال های مضر. با گذشت زمان، ما از این تکنیک استفاده خواهیم کرد تا مدل های خود را برای همه کاربران مسئولیت پذیرتر و ایمن تر کنیم.

قرار دادن BlenderBot 3 برای آزمایش

در مقایسه با نسخه های قبلی خود، متوجه شدیم که BlenderBot 3 31٪ در کارهای مکالمه بهبود یافته است. همچنین دو برابر دانش است، در حالی که از نظر واقعی نادرست است 47٪ کمتر. ما همچنین دریافتیم که تنها 0.16٪ از پاسخ های BlenderBot به مردم به عنوان بی ادبانه یا نامناسب علامت گذاری شده است.

هدف تحقیق ما جمع آوری و انتشار داده های بازخوردی است که ما و جامعه تحقیقاتی گسترده تر هوش مصنوعی می توانیم در طول زمان از آنها استفاده کنیم. به این ترتیب، ما می‌توانیم راه‌های جدیدی برای ایمن‌تر و جذاب‌تر بودن سیستم‌های هوش مصنوعی برای افرادی که از آن‌ها استفاده می‌کنند، پیدا کنیم.

رانندگی به جلو با هوش مصنوعی محاوره ای

پیشرفت در زمینه هوش مصنوعی به شدت به فرصتی برای جامعه تحقیقاتی گسترده‌تر هوش مصنوعی برای ایجاد بهترین فناوری موجود بستگی دارد. بنابراین، انتشار مدل‌ها و مجموعه داده‌های ربات چت برای به دست آوردن بینش کامل و قابل اعتماد در مورد چگونگی و چرایی کار، پتانسیل و محدودیت‌هایشان کلیدی است.

در حالی که BlenderBot 3 به طور قابل توجهی چت ربات های در دسترس عموم را پیشرفت می دهد، مطمئناً در سطح انسانی نیست. گاهی اوقات نادرست، ناسازگار و خارج از موضوع است. همانطور که افراد بیشتری با نسخه نمایشی ما تعامل دارند، مدل‌های خود را با استفاده از بازخورد و انتشار داده‌های آنها بهبود می‌بخشیم تا به نفع جامعه گسترده‌تر هوش مصنوعی باشد.

درباره BlenderBot 3 بیشتر بدانید





منبع