افسانه‌ی بات کنایه‌آمیز و دیگر داستان‌های موتور هوش مصنوعی GPT3




 

تابستان سال 2020، یک رخداد بزرگ در فن‌آوری هوش مصنوعی شکل گرفت. یک پیشرفت اساسی در زمینه‌ی درک ماشین‌ها از گفت‌وگوهای بیان شده به زبان طبیعی انسان‌ها، جامعه‌ی فن‌آوری هوش مصنوعی را غافلگیر کرد. موسسه‌ی OpenAI آخرین نسخه‌ی مدل درک زبان طبیعی خود به‌نام GPT3 را به بازار معرفی کرد. این بار، موسسه‌ی OpenAI تصمیم گرفت این موتور درک زبان طبیعی را به صورت متن باز (و به شکلی که موتور قبلی GPT2 را منتشر کرده بود) در اختیار عموم قرار ندهد. در مقابل، این موسسه، سرویسی را از طریق یک API در اختیار توسعه‌دهندگان قرار خواهد داد که در حال حاضر در اختیار تعداد محدودی توسعه‌دهنده، قرار گرفته است. این موتور درک زبان طبیعی، تاثیر بسزایی در صنعت امور مشتریان و عموم فعالیت‌هایی خواهد گذاشت که به درک زبان طبیعی نیاز دارند.

در این مقاله، با روش کار این API آشنا خواهیم شد و نمونه‌هایی از کارکرد آن را خواهیم دید.

تاکنون، سیستم‌های درک زبان طبیعی نیاز داشتند برای کارکرد صحیح در زمینه‌هایی مانند طبقه‌بندی متون، خلاصه نویسی یا ترجمه از یک زبان به زبان دیگر با حجم قابل توجهی از داده‌ها آموزش دیده و تنظیم شوند. این فرآیند عموما به حجم زیادی از زمان و نیروی تخصصی نیاز دارد. یکی از دشواری‌های اصلی این کار، جمع‌آوری و برچسب‌گذاری (Labeling) صحیح داده‌های مورد نیاز برای آموزش مدل بکار گرفته شده است. شما برای هر مورد، نیاز به صدها پاسخ صحیح و ناصحیح خواهید داشت. نمونه‌هایی که باید به‌درستی برچسب‌گذاری شده و هر اشتباه جزیی می‌تواند مدل به دست آمده را ناکارآمد نماید.

موتور GPT3 چه تفاوتی با نمونه‌های قبلی دارد؟

اولین تفاوت این موتور در رابط استفاده از آن است. این موتور به صورت «دریافت متن ورودی و ارسال متن خروجی» کار می‌کند. رابطی که برای بسیاری از خواسته‌ها مانند طبقه‌بندی، خلاصه نویسی، تولید متن، ترجمه و موارد دیگر بخوبی قابل استفاده است. در حقیقت، GPT3 یک موتور تولید متن است که عبارت بعدی نوشته‌ی شما را بر اساس بخش قبلی نوشته شده پیش‌بینی می‌نماید.

تفاوت اساسی دوم در آن است که شما می‌توانید با دستور دادن به GPT3 به آن آموزش دهید انتظار چه کاری از آن دارید. در حقیقت به جای فراهم آوردن تعداد معتنابهی از نمونه داده‌های برچسب‌گذاری شده، به موتور GPT3 توضیح می‌دهید چه انتظاری از آن دارید تا خواسته‌ی شما برآورده شود!

سومین تفاوت اساسی در سرعت یادگیری مدل است. تنها با در اختیار قراردادن یکی دو نمونه، این مدل خواسته‌ی شما را یاد می‌گیرد. در فن‌آوری هوش مصنوعی، این امکان «یادگیری فقط با چند حرکت» نامیده می‌شود و برای سال‌ها آروزی دانشمندان این صنعت بوده است.

موتور GPT3 چگونه کار می‌کند؟

همان‌گونه که پیشتر تشریح شد، GPT3 یک موتور تولید متن است. شما با وارد کردن یک متن یا یک دستور، کار خود را آغاز می‌کنید و موتور GPT3 پاسخ شما را به صورت درک فرمان شما یا انتخاب بهترین متن در ادامه‌ی نوشته‌ی شما به شما بازمی‌گرداند.

اجازه بدهید به یک نمونه‌ی ساده نگاه کنیم. در تصویر زیر، من از GPT3 میخواهم لیستی از شخصیت‌های افسانه‌ای Marvel برای من تهیه کند. ورودی من به سیستم اسامی

1 – Hulk

2 – Ironman

هستند و خروجی سیستم به این شکل خواهد بود:

1 – Hulk

2 – Ironman

3 – Captain America

4 – Thor

5 – Hawkeye

(لیست شخصیت‌های کامل به عنوان خروجی ارسال می‌شود)

توجه داشته باشید که من مدل را آموزش نداده‌ام و تنها با وارد کردن دو اسم از لیست شخصیت‌های افسانه‌ای پاسخ کاملی از لیست آنها دریافت کرده‌ام.

بات Marv همراه با کنایه!

این بار از GPT3 می‌خواهم به پرسش‌هایی عمومی پاسخ دهد اما انتظار دارم لحن آن با مقداری کنایه همراه باشد. فرآیند شبیه فرآیند قبلی است. نیازی به فعالیت حجیم و سنگینی برای آموزش مدل وجود ندارد. تنها استفاده از API ارایه شده و در اختیار قرار دادن چهار نمونه برای یادگیری. نتیجه ایجاد مدلی است که در پاسخ به پرسش‌های کاربران، اطلاعات مورد نیاز را به همراه عبارت‌هایی طنز یا کنایه آمیز و با رعایت ادب در اختیار کاربران قرار می‌دهد:

User: How many pounds are in a kilogram?

Marv: That again? There are 2.2 pounds in a kilogram. Please make a note of it

کاربر: یک کیلوگرم چند پونده؟

مارو: ای بابا! بازم پرسیدی؟ یک کیلو 2.2 پونده. یه جایی بنویس یادت نره.

 

User: What does HTML stand for?

Marv: Was Google too busy? Hypertext Markup Language. The T is to Try and ask a better question next time.

کاربر: اصطلاح HTML مخفف چیه؟

مارو: ببینم گوگل سرش شلوغ بود اومدی سراغ من!؟ عبارت مخفف Hypertext Markup Language اون حرف T که توش هست یعنی سعی کنی (Try) دفعه‌ی بعد سوالای بهتری بپرسی.

توجه داشته باشید که API ای که از آن استفاده می‌کنید نه تنها پاسخ‌های صحیح پرسش‌های شما را در اختیار شما قرار می‌دهد بلکه در تهیه‌ی پاسخ خود از الگوی طنزی که از پاسخ‌های قبلی شما برداشت شده نیز استفاده می‌نماید.

تلخیص دستور کارهای مشتریان

اجازه بدهید به یک نمونه از خدمات امور مشتریان بپردازیم. همه‌ی ما تعداد معتنابهی ایمیل از مشتریان دریافت می‌کنیم و مدت زیادی از زمان خود را صرف درک آنها می‌کنیم. در مثال زیر از موتور GPT3 خواسته‌ام در مورد هر ایمیل از یک مشتری به چهار پرسش از پیش تعیین شده پاسخ دهد:

پرسش مشتری در خصوص چه محصولی است؟

شکایت مشتری از چه موضوعی است؟

آیا مشتری به دنبال پس دادن کالا و دریافت وجه خود است؟

مشتری چه حسی دارد؟

نمونه‌ی کارکرد GPT3 در تصویر زیر آمده است:

(در تصویر مشاهده می‌کنیم که مشتری در یک ایمیل طولانی، مشکل خود در مورد خرید گوشی هوشمند iPhone را عدم کارکرد صحیح باطری اعلام می‌نماید و تقاضا دارد مبلغ خرید خود را دریافت نماید. همچنین مشتری احساس ناراحتی و خیانت به اعتمادی که به شرکت نموده است را بیان می‌کند. تمامی این موارد توسط GPT3 تشخیص داده شده است).

هوش مصنوعی فراگیر برای عموم

از روزهای آغازین یادگیری عمیق (Deep Learning)، فن‌آوری هوش مصنوعی در شاخه‌هایی مانند درک زبان طبیعی و دید ماشینی، راه زیادی را طی نموده است. رقابت در این زمینه‌ها به بُروز محصولی منحصر بفرد به نام GPT3 انجامیده است. با وجود این که موسسه‌ی OpenAI اولین موسسه‌ای است که به چنین سطحی از فن‌آوری دست یافته است، قطعا آخرین آنها نخواهد بود. منتظر ارایه‌ی محصولات مشابهی از بزرگان این صنعت مانند گوگل یا آمازون یا فیس بوک باشید. مهم‌تر از همه آن است که تمامی این تلاش‌ها، هوش مصنوعی را به یک فن‌آوری فراگیر و قابل استفاده توسط اقشار مختلف تبدیل خواهند نمود.

 

منبع:

https://customerthink.com/the-tale-of-a-sarcastic-bot-and-other-gpt-3-stories/

 

به اشتراک بگذارید