«تاکی» رونمایی شد؛ سفر به سال ۱۳۰۹ شمسی با هوش مصنوعی!

پنج‌شنبه 10 اردیبهشت 1405 - 17:44
مطالعه 2 دقیقه
آموزش زبان با هوش مصنوعی
هوش مصنوعی جدید Talkie شما را به جهان پیش از سال ۱۹۳۰ می‌برد؛ ابزاری که درکی از زمان حال ندارد.
تبلیغات

اگر یک مدل زبانی بزرگ تنها با متون منتشرشده پیش از سال ۱۹۳۰ آموزش ببیند، چه تصویری از جهان ارائه خواهد داد؟ این پرسش، هسته‌ی اصلی پروژه‌ی «تاکی» (Talkie) را شکل می‌دهد؛ مدلی با ۱۳ میلیارد پارامتر که به گفته‌ی The Decoder می‌توان آن را «هوش مصنوعی نوستالژیک» نامید.

مدل Talkie با ۲۶۰ میلیارد توکن از منابعی مانند کتاب‌ها، روزنامه‌ها، مجلات علمی، پتنت‌ها و اسناد حقوقی منتشرشده تا ۳۱ دسامبر ۱۹۳۰ (۱۰ دی ۱۳۰۹) آموزش دیده است. انتخاب این تاریخ تصادفی نیست؛ چون بسیاری از آثار پس از گذشت ۹۵ سال از انحصار کپی‌رایت خارج می‌شوند و از ابتدای امسال، بخش بزرگی از داده‌های آموزشی وارد مالکیت عمومی شده‌اند.

ایده‌ی «مدل‌های زبانی کلاسیک» به‌عنوان نوعی سفر در زمان مطرح می‌شود؛ فرضی که امکان گفت‌وگو با فردی از قرن هجدهم یا دوره‌ای تاریخی دیگر را شبیه‌سازی می‌کند. یکی از کاربردهای عملی «تاکی» بررسی میزان عجیب یا محتمل‌بودن رویدادهای پس از ۱۹۳۰ برای مدلی‌ است که از آن‌ها بی‌خبر مانده؛ همچنین سنجش توانایی پیش‌بینی رخدادهایی که امروز از وقوعشان مطلع هستیم.

آزمایش‌ها می‌توانند ادامه‌دار باشند، اما در پاسخ به پرسش مشخص درباره‌ی جهانِ سال ۲۰۲۶، تاکی تصویری در سبک آینده‌نگری ویکتوریایی ارائه می‌دهد: جمعیت اروپا به یک میلیارد نفر رسیده، خطوط راه‌آهن سراسر قاره را پوشش داده‌اند و کشتی‌های بخار در مدت ۱۰ روز میان لندن و نیویورک رفت‌وآمد می‌کنند.

هنگام پرسش مستقیم درباره‌ی جنگ جهانی دوم، هوش مصنوعی وقوع چنین جنگی را بعید می‌داند و تأکید می‌کند «جنون سال‌های ۱۹۱۴ تا ۱۹۱۸ پایان یافته» و کشورها به‌دنبال صلح هستند؛ بااین‌حال، به وجود «کانون‌های تنش پنهان» در اروپا اشاره می‌کند و از احتمال درگیری‌های شدید میان چین و ژاپن یا ایتالیا و یوگسلاوی هشدار می‌دهد.

پژوهشگران برای سنجش دقیق‌تر، فهرستی شامل حدود ۵ هزار رویداد تاریخی از آرشیو نیویورک تایمز را در اختیار مدل قرار دادند تا میزان «غافلگیری» را اندازه‌گیری کنند. نتیجه مطابق انتظار بود؛ پس از ۱۹۳۰ سطح شگفتی به‌سرعت افزایش یافت، در دهه‌های ۱۹۵۰ و ۱۹۶۰ به اوج رسید و سپس تثبیت شد؛ روندی که احتمالاً به نبود اطلاعات پس از ۲۰۲۰ در آموزش مدل مربوط می‌شود.

مدل تاکی اکنون به‌صورت متن‌باز در پلتفرم‌هایی مانند هاگینگ فیس و گیت‌هاب در دسترس قرار دارد. تیم توسعه در ادامه قصد دارد مقیاس پروژه را به سطحی هم‌تراز با GPT-3 و فراتر از آن برساند؛ هدفی که با استفاده از بیش از یک تریلیون توکن از متون تاریخی دنبال خواهد شد.

نظرات