«تاکی» رونمایی شد؛ سفر به سال ۱۳۰۹ شمسی با هوش مصنوعی!
اگر یک مدل زبانی بزرگ تنها با متون منتشرشده پیش از سال ۱۹۳۰ آموزش ببیند، چه تصویری از جهان ارائه خواهد داد؟ این پرسش، هستهی اصلی پروژهی «تاکی» (Talkie) را شکل میدهد؛ مدلی با ۱۳ میلیارد پارامتر که به گفتهی The Decoder میتوان آن را «هوش مصنوعی نوستالژیک» نامید.
مدل Talkie با ۲۶۰ میلیارد توکن از منابعی مانند کتابها، روزنامهها، مجلات علمی، پتنتها و اسناد حقوقی منتشرشده تا ۳۱ دسامبر ۱۹۳۰ (۱۰ دی ۱۳۰۹) آموزش دیده است. انتخاب این تاریخ تصادفی نیست؛ چون بسیاری از آثار پس از گذشت ۹۵ سال از انحصار کپیرایت خارج میشوند و از ابتدای امسال، بخش بزرگی از دادههای آموزشی وارد مالکیت عمومی شدهاند.
ایدهی «مدلهای زبانی کلاسیک» بهعنوان نوعی سفر در زمان مطرح میشود؛ فرضی که امکان گفتوگو با فردی از قرن هجدهم یا دورهای تاریخی دیگر را شبیهسازی میکند. یکی از کاربردهای عملی «تاکی» بررسی میزان عجیب یا محتملبودن رویدادهای پس از ۱۹۳۰ برای مدلی است که از آنها بیخبر مانده؛ همچنین سنجش توانایی پیشبینی رخدادهایی که امروز از وقوعشان مطلع هستیم.
آزمایشها میتوانند ادامهدار باشند، اما در پاسخ به پرسش مشخص دربارهی جهانِ سال ۲۰۲۶، تاکی تصویری در سبک آیندهنگری ویکتوریایی ارائه میدهد: جمعیت اروپا به یک میلیارد نفر رسیده، خطوط راهآهن سراسر قاره را پوشش دادهاند و کشتیهای بخار در مدت ۱۰ روز میان لندن و نیویورک رفتوآمد میکنند.
هنگام پرسش مستقیم دربارهی جنگ جهانی دوم، هوش مصنوعی وقوع چنین جنگی را بعید میداند و تأکید میکند «جنون سالهای ۱۹۱۴ تا ۱۹۱۸ پایان یافته» و کشورها بهدنبال صلح هستند؛ بااینحال، به وجود «کانونهای تنش پنهان» در اروپا اشاره میکند و از احتمال درگیریهای شدید میان چین و ژاپن یا ایتالیا و یوگسلاوی هشدار میدهد.
پژوهشگران برای سنجش دقیقتر، فهرستی شامل حدود ۵ هزار رویداد تاریخی از آرشیو نیویورک تایمز را در اختیار مدل قرار دادند تا میزان «غافلگیری» را اندازهگیری کنند. نتیجه مطابق انتظار بود؛ پس از ۱۹۳۰ سطح شگفتی بهسرعت افزایش یافت، در دهههای ۱۹۵۰ و ۱۹۶۰ به اوج رسید و سپس تثبیت شد؛ روندی که احتمالاً به نبود اطلاعات پس از ۲۰۲۰ در آموزش مدل مربوط میشود.
مدل تاکی اکنون بهصورت متنباز در پلتفرمهایی مانند هاگینگ فیس و گیتهاب در دسترس قرار دارد. تیم توسعه در ادامه قصد دارد مقیاس پروژه را به سطحی همتراز با GPT-3 و فراتر از آن برساند؛ هدفی که با استفاده از بیش از یک تریلیون توکن از متون تاریخی دنبال خواهد شد.