رویداد «هوش مصنوعی و قند پارسی» برگزار شد؛ از رؤیای «نماد ملی» تا نیاز به حل مسئله واقعی
رویداد «هوش مصنوعی و قند پارسی» روز شنبه، ۳ خرداد، با حضور متخصصان و سیاستگذاران اکوسیستم فناوری در سالن همایشهای کتابخانهی ملی ایران برگزار شد. این رویداد را مرکز تحقیقات هوش مصنوعی پارت سازماندهی کرده بود و به بررسی آخرین دستاوردها در حوزهی مدلهای زبانی فارسی و چالشهای پیش روی توسعهی آنها اختصاص داشت.
در ابتدای رویداد، دکتر علیاصغر انصاری، مشاور هوشمندسازی پژوهشگاه ارتباطات و فناوری اطلاعات، توسعهی مدلهای زبانی بومی را «الزام راهبردی» خواند. او با اشاره به توجیه اقتصادی و نقش این مدلها در حفظ هویت ملی، تأکید کرد: «ما در حوزهی مدلهای زبانی بومی، مزیت رقابتی زیادی داریم. این مدلها ازنظر کیفیت و انطباق با فرهنگ و زبان و ادبیات فارسی در مقایسه با نمونههای خارجی برتری دارند.»
در بخش دیگری از رویداد «هوش مصنوعی و قند پارسی»، مرکز تحقیقات هوش مصنوعی پارت از جدیدترین دستاوردهای خود پردهبرداری کرد. دکتر امیرمحمد صالحاوف، مدیر تیم پردازش زبان طبیعی این مرکز، ضمن مرور تاریخچهی فعالیتهای پارت از سال ۱۳۹۶، دو محصول جدید را معرفی کرد:
- نسخهی دوم چهارچوب ارزیابی Open Persian LLM Leaderboard: این ابزار بهعنوان بنچمارک دقیقتر برای ارزیابی و مقایسهی عملکرد مدلهای زبان فارسی در اختیار توسعهدهندگان قرار گرفته است.
- نسخهی دوم مدل زبانی «Tooka-SBERT-V2»: این مدل سبکوزن (Lightweight) برای درک مفاهیم زبانی، بهویژه در سرویسهای مشابهتیابی (Similarity) بهینه شده و بهدلیل حجم اندک، روی سختافزارهای معمول اجرایی است.
در مراسم «هوش مصنوعی و قند پارسی»، شمارهی جدید فصلنامهی «دیدهبان هوش مصنوعی» با عنوان «نوآوری بیپایان» نیز رونمایی شد. براساس اعلام دکتر ایمان ظهوریان، معاونت استراتژیک پارت، نسخهی جدید «دیدهبان هوش مصنوعی» به آیندهنگاری هوش مصنوعی مولد در ایران اختصاص دارد.
بخش پایانی رویداد به پنل تخصصی «ترسیم چشمانداز مدلهای زبانی» اختصاص داشت. در این پنل، متخصصان دانشگاهی و صنعتی بحث و تبادل نظر کردند. دکتر الهام فراهانی، عضو هیئتمدیرهی انجمن ملی هوش مصنوعی ایران، بر لزوم ایجاد «ارادهی جمعی» برای توسعه و در دسترس قراردادن عمومی و رایگان مدلهای بومی تأکید کرد.
دکتر سعیده ممتازی، عضو هیئتعلمی دانشگاه امیرکبیر، با اشاره به «کمبود زیرساخت»، بهینهسازی مدلهای متنباز موجود را بهعنوان راهکار عملی پیشنهاد داد. ممتازی گفت که شاید مدلهای زبانی خارجی، اکنون عملکرد موفقی در زبان فارسی داشته باشند؛ اما در پسِ زبان، فرهنگ هم قرار دارد و این مدلها درزمینهی فرهنگ نمیتوانند کارساز باشند. او نقش دولت را نیز مواردی همچون حمایت مالی و رگولاتوری و تقسیم وظایف دانست.
در همین زمینه، دکتر محمدرضا محمدی، عضو هیئتعلمی دانشگاه علم و صنعت، از توسعهی مدلها صرفاً برای داشتن «نماد ملی» انتقاد کرد و گفت: «باید مسئلهمحور حرکت کنیم؛ یعنی مشخص کنیم که این مدل زبانی در کدام بخش از دادههای فارسی ضعف دارد یا پاسخگو نیست. سپس براساس آن، اقدام به توسعه یا بهینهسازی کنیم.»
محمدی میگوید که توسعهی هوش مصنوعی از ابتدا (From Scratch) اقتصادی نیست؛ اما ازلحاظ استراتژیک و با نگاه منافع ملی، توسعهی چنین مدلی ضروری است. او دربارهی نقش دولت نیز گفت که خود زیستبوم باید درزمینهی سازوکار آن تصمیم بگیرد.
در حاشیهی رویداد، شرکتکنندگان امکان بررسی دموی مدلهای متنبازشده و توسهیافتهی پارت ازجمله مدل درنا را داشتند. مرکز تحقیقات پارت اعلام کرده است که مدلهای زبانی منبعباز این مجموعه ازطریق درگاههای رسمی آن در دسترس عموم قرار دارد.