افسانهی بات کنایهآمیز و دیگر داستانهای موتور هوش مصنوعی GPT3
تابستان سال 2020، یک رخداد بزرگ در فنآوری هوش مصنوعی شکل گرفت. یک پیشرفت اساسی در زمینهی درک ماشینها از گفتوگوهای بیان شده به زبان طبیعی انسانها، جامعهی فنآوری هوش مصنوعی را غافلگیر کرد. موسسهی OpenAI آخرین نسخهی مدل درک زبان طبیعی خود بهنام GPT3 را به بازار معرفی کرد. این بار، موسسهی OpenAI تصمیم گرفت این موتور درک زبان طبیعی را به صورت متن باز (و به شکلی که موتور قبلی GPT2 را منتشر کرده بود) در اختیار عموم قرار ندهد. در مقابل، این موسسه، سرویسی را از طریق یک API در اختیار توسعهدهندگان قرار خواهد داد که در حال حاضر در اختیار تعداد محدودی توسعهدهنده، قرار گرفته است. این موتور درک زبان طبیعی، تاثیر بسزایی در صنعت امور مشتریان و عموم فعالیتهایی خواهد گذاشت که به درک زبان طبیعی نیاز دارند.
در این مقاله، با روش کار این API آشنا خواهیم شد و نمونههایی از کارکرد آن را خواهیم دید.
تاکنون، سیستمهای درک زبان طبیعی نیاز داشتند برای کارکرد صحیح در زمینههایی مانند طبقهبندی متون، خلاصه نویسی یا ترجمه از یک زبان به زبان دیگر با حجم قابل توجهی از دادهها آموزش دیده و تنظیم شوند. این فرآیند عموما به حجم زیادی از زمان و نیروی تخصصی نیاز دارد. یکی از دشواریهای اصلی این کار، جمعآوری و برچسبگذاری (Labeling) صحیح دادههای مورد نیاز برای آموزش مدل بکار گرفته شده است. شما برای هر مورد، نیاز به صدها پاسخ صحیح و ناصحیح خواهید داشت. نمونههایی که باید بهدرستی برچسبگذاری شده و هر اشتباه جزیی میتواند مدل به دست آمده را ناکارآمد نماید.
موتور GPT3 چه تفاوتی با نمونههای قبلی دارد؟
اولین تفاوت این موتور در رابط استفاده از آن است. این موتور به صورت «دریافت متن ورودی و ارسال متن خروجی» کار میکند. رابطی که برای بسیاری از خواستهها مانند طبقهبندی، خلاصه نویسی، تولید متن، ترجمه و موارد دیگر بخوبی قابل استفاده است. در حقیقت، GPT3 یک موتور تولید متن است که عبارت بعدی نوشتهی شما را بر اساس بخش قبلی نوشته شده پیشبینی مینماید.
تفاوت اساسی دوم در آن است که شما میتوانید با دستور دادن به GPT3 به آن آموزش دهید انتظار چه کاری از آن دارید. در حقیقت به جای فراهم آوردن تعداد معتنابهی از نمونه دادههای برچسبگذاری شده، به موتور GPT3 توضیح میدهید چه انتظاری از آن دارید تا خواستهی شما برآورده شود!
سومین تفاوت اساسی در سرعت یادگیری مدل است. تنها با در اختیار قراردادن یکی دو نمونه، این مدل خواستهی شما را یاد میگیرد. در فنآوری هوش مصنوعی، این امکان «یادگیری فقط با چند حرکت» نامیده میشود و برای سالها آروزی دانشمندان این صنعت بوده است.
موتور GPT3 چگونه کار میکند؟
همانگونه که پیشتر تشریح شد، GPT3 یک موتور تولید متن است. شما با وارد کردن یک متن یا یک دستور، کار خود را آغاز میکنید و موتور GPT3 پاسخ شما را به صورت درک فرمان شما یا انتخاب بهترین متن در ادامهی نوشتهی شما به شما بازمیگرداند.
اجازه بدهید به یک نمونهی ساده نگاه کنیم. در تصویر زیر، من از GPT3 میخواهم لیستی از شخصیتهای افسانهای Marvel برای من تهیه کند. ورودی من به سیستم اسامی
1 – Hulk
2 – Ironman
هستند و خروجی سیستم به این شکل خواهد بود:
1 – Hulk
2 – Ironman
3 – Captain America
4 – Thor
5 – Hawkeye
(لیست شخصیتهای کامل به عنوان خروجی ارسال میشود)
توجه داشته باشید که من مدل را آموزش ندادهام و تنها با وارد کردن دو اسم از لیست شخصیتهای افسانهای پاسخ کاملی از لیست آنها دریافت کردهام.
بات Marv همراه با کنایه!
این بار از GPT3 میخواهم به پرسشهایی عمومی پاسخ دهد اما انتظار دارم لحن آن با مقداری کنایه همراه باشد. فرآیند شبیه فرآیند قبلی است. نیازی به فعالیت حجیم و سنگینی برای آموزش مدل وجود ندارد. تنها استفاده از API ارایه شده و در اختیار قرار دادن چهار نمونه برای یادگیری. نتیجه ایجاد مدلی است که در پاسخ به پرسشهای کاربران، اطلاعات مورد نیاز را به همراه عبارتهایی طنز یا کنایه آمیز و با رعایت ادب در اختیار کاربران قرار میدهد:
User: How many pounds are in a kilogram?
Marv: That again? There are 2.2 pounds in a kilogram. Please make a note of it
کاربر: یک کیلوگرم چند پونده؟
مارو: ای بابا! بازم پرسیدی؟ یک کیلو 2.2 پونده. یه جایی بنویس یادت نره.
User: What does HTML stand for?
Marv: Was Google too busy? Hypertext Markup Language. The T is to Try and ask a better question next time.
کاربر: اصطلاح HTML مخفف چیه؟
مارو: ببینم گوگل سرش شلوغ بود اومدی سراغ من!؟ عبارت مخفف Hypertext Markup Language اون حرف T که توش هست یعنی سعی کنی (Try) دفعهی بعد سوالای بهتری بپرسی.
توجه داشته باشید که API ای که از آن استفاده میکنید نه تنها پاسخهای صحیح پرسشهای شما را در اختیار شما قرار میدهد بلکه در تهیهی پاسخ خود از الگوی طنزی که از پاسخهای قبلی شما برداشت شده نیز استفاده مینماید.
تلخیص دستور کارهای مشتریان
اجازه بدهید به یک نمونه از خدمات امور مشتریان بپردازیم. همهی ما تعداد معتنابهی ایمیل از مشتریان دریافت میکنیم و مدت زیادی از زمان خود را صرف درک آنها میکنیم. در مثال زیر از موتور GPT3 خواستهام در مورد هر ایمیل از یک مشتری به چهار پرسش از پیش تعیین شده پاسخ دهد:
پرسش مشتری در خصوص چه محصولی است؟
شکایت مشتری از چه موضوعی است؟
آیا مشتری به دنبال پس دادن کالا و دریافت وجه خود است؟
مشتری چه حسی دارد؟
نمونهی کارکرد GPT3 در تصویر زیر آمده است:
(در تصویر مشاهده میکنیم که مشتری در یک ایمیل طولانی، مشکل خود در مورد خرید گوشی هوشمند iPhone را عدم کارکرد صحیح باطری اعلام مینماید و تقاضا دارد مبلغ خرید خود را دریافت نماید. همچنین مشتری احساس ناراحتی و خیانت به اعتمادی که به شرکت نموده است را بیان میکند. تمامی این موارد توسط GPT3 تشخیص داده شده است).
هوش مصنوعی فراگیر برای عموم
از روزهای آغازین یادگیری عمیق (Deep Learning)، فنآوری هوش مصنوعی در شاخههایی مانند درک زبان طبیعی و دید ماشینی، راه زیادی را طی نموده است. رقابت در این زمینهها به بُروز محصولی منحصر بفرد به نام GPT3 انجامیده است. با وجود این که موسسهی OpenAI اولین موسسهای است که به چنین سطحی از فنآوری دست یافته است، قطعا آخرین آنها نخواهد بود. منتظر ارایهی محصولات مشابهی از بزرگان این صنعت مانند گوگل یا آمازون یا فیس بوک باشید. مهمتر از همه آن است که تمامی این تلاشها، هوش مصنوعی را به یک فنآوری فراگیر و قابل استفاده توسط اقشار مختلف تبدیل خواهند نمود.
منبع:
https://customerthink.com/the-tale-of-a-sarcastic-bot-and-other-gpt-3-stories/