مدل بزرگ زبانی 8 میلیاردی از گروه درنا به صورت متن‌باز عرضه شد

دوشنبه ۲۱ خرداد ۱۴۰۳ - ۱۱:۰۰
مطالعه 3 دقیقه
پارت
این مطلب صرفا جنبه تبلیغاتی داشته و زومیت هیچ مسئولیتی را در رابطه با آن نمی‌پذیرد
مرکز تحقیقات هوش مصنوعی پارت از تازه‌ترین دستاورد خود در زمینه مدل‌های بزرگ زبانی (LLMs) پرده برداشت.
تبلیغات

مرکز تحقیقات هوش مصنوعی پارت از تازه‌ترین دستاورد خود در زمینه مدل‌های بزرگ زبانی (LLMs) پرده برداشت و یکی از مدل های 8 میلیارد پارامتری خود که متعلق به گروه مدل‌های زبانی درنا است را به‌صورت متن باز در دسترس اکوسیستم هوش مصنوعی کشور قرار داد. این مدل با استفاده از کلان داده‌های زبان فارسی آموزش دیده و به صورت رایگان و متن‌باز توسط عموم توسعه‌دهندگان و کسب‌وکارهای حوزه هوش مصنوعی قابل دریافت است.

بسیاری از LLMهای مطرح دنیا که به‌صورت منبع‌باز ارائه شده‌اند، بر پایه زبان انگلیسی، زبان‌های برنامه‌نویسی و برخی از زبان‌های پرکاربرد جهانی آموزش دیده‌اند و بهترین عملکرد خود را در چنین زبان‌هایی به نمایش می‌گذارند. این در حالی است که بسیاری از زبان‌های زنده و محبوب مانند فارسی توسط LLMها پشتیبانی نمی‌شوند و یا در صورت پشتیبانی، با ایرادات بسیاری همراه هستند. در چنین موقعیتی، اهمیت مدل‌هایی مانند درنا که با تمرکز حداکثری بر زبان فارسی توسعه پیدا کرده‌اند، بیش‌ازپیش خودنمایی می‌کند.

طی ماه‌های اخیر، مرکز تحقیقات هوش مصنوعی پارت با معرفی گروه مدل بزرگ زبانی درنا و مدل زبانی توکا، در راستای هدف خود برای رشد و گسترش زیست‌بوم نوآوری و هوش مصنوعی فارسی گام برداشته است. حال در امتداد دستیابی به این هدف، پارت قصد دارد تا با عرضه یک مدل 8 میلیارد پارامتری از گروه مدل‌های درنا به‌صورت متن‌باز، روند ساخت محصولات مبتنی بر هوش مصنوعی فارسی مانند دستیارها، چت‌بات‌ها و دیگر ابزارهای هوشمند را برای اکوسیستم هوش مصنوعی و کسب‌وکارها از همیشه ساده‌تر و کارآمدتر کند.

این مدل زبانی بزرگ 8 میلیارد پارامتری با استفاده از جدیدترین معماری و فناوری روز دنیا در زمینه مدل‌های زبانی توسعه یافته که باعث می‌شود این مدل فارسی، حتی در مقایسه با برخی مدل‌های بزرگتر از خود، کارکرد بهتری داشته باشد و عملکردی دقیق‌تر از تمامی مدل‌های فارسی منتشرشده تا به امروز به ثبت برساند. به‌علاوه، این مدل درنا، در مأموریت خود که توسعه بهینه‌ترین مدل‌های زبانی مبتنی بر فارسی است، دستاورد چشمگیری داشته و موفق شده در شاخص‌های زبان فارسی از بسیاری از مدل‌های مطرح دنیا پیشی گیرد؛ تا جایی که نمره کلی بهتری در ارزیابی‌ و مقایسه با مدل‌هایی همچون Meta Llama 3 کسب‌ کرده و به طور چشمگیری در تعاملات زبان بومی و  پس زمینه‌های فرهنگی ایرانی و فارسی، عملکرد بهتری نسبت به مشابه های خارجی دارد. جزئيات بیشتر در خصوص مقایسه‌ها و ارزیابی‌های این مدل درنا در صفحه مرکز تحقیقات هوش مصنوعی پارت در سایت هاگینگ فیس قابل مشاهده است.

خلاصه‌سازی متون، کدنویسی، تشخیص احساسات، پاسخ به سؤالات طولانی، پرسش و پاسخ‌های بله و خیر، پاسخ به سؤالات عمومی، تاریخی، ریاضی، اخبار و... تنها بخشی از توانمندی‌های این مدل بزرگ زبانی است و رفته‌‎رفته با افزایش کاربران و اعمال بازخوردهای دریافتی، عملکرد بخش‌های مختلف این مدل نیز به طور مداوم بهبود پیدا می‌کند.

یکی از مهم‌ترین ویژگی‌های برنامه‌های متن‌باز، قابلیت شخصی‌سازی گسترده آن‌هاست و مدل 8 میلیاردی از گروه درنا هم از این قاعده مستثنا نیست. پارت این امکان را برای کسب‌وکارها، توسعه‌دهندگان و محققان فراهم کرده که این مدل متن‌باز درنا را بر پایه داده‌های خود شخصی‌سازی یا به اصطلاح Fine-tune کنند و ویژگی‌های گوناگونی را متناسب با کسب‌وکار و اهداف خود به مدل نهایی خود بیفزایند. علاوه بر این،‌ پارت برای اولین بار در ایران، از این مدل زبانی بزرگ روی سرورهای هاگینگ فیس میزبانی می‌کند، تا کاربران بدون نیاز به زیرساخت یا سخت‌افزار، به صورت رایگان این LLM ۸ میلیارد پارامتری را در این سایت تست و آزمایش کنند.

با توجه به اقدامات اخیر صورت گرفته توسط این مجموعه، پارت توسعه مدل‌های زبانی را در کنار سایر اهداف خود ادامه می‌دهد و برنامه دارد طی ماه‌های آینده، در کنار این مدل 8 میلیاردی متن‌باز، از سایر مدل‌های بزرگتر گروه درنا هم در محصولات تجاری خود استفاده کند.

شما می‌توانید با مراجعه به لینک زیر، آخرین نسخه از این مدل زبانی را دریافت و آن را به صورت رایگان، تست و ارزیابی کنید:

{لینک دسترسی به مدل درنا}

تبلیغات
داغ‌ترین مطالب روز
تبلیغات

نظرات