D1-kifpool

آپدیت ۲۰۲۵ دیپ سیک؛ هوش مصنوعی جنجالی چینی قدرتمندتر و بهینه‌تر شد

سه‌شنبه ۵ فروردین ۱۴۰۴ - ۰۹:۳۰
مطالعه 2 دقیقه
هوش مصنوعی دیپ سیک
دیپ‌سیک نسخه‌ی بهبودیافته‌ی مدل زبانی بزرگ V3 را تحت مجوز متن‌باز MIT و با قدرت بیشتر از نسخه‌ی قبلی منتشر کرد.
تبلیغات
D4-mcid4

دیپ‌سیک، استارتاپ پرحاشیه‌ی چینی، نسخه‌ی بهبودیافته‌ی مدل زبانی بزرگ DeepSeek-V3 را تحت مجوز متن‌باز (اوپن‌سورس) MIT منتشر کرد.

نسخه‌ی جدید در سکوت خبری منتشر شده و دیپ‌سیک هیچ بیانیه‌ای را در دسترس رسانه‌ها قرار نداده است. به‌علاوه، فایل Readme مدل جدید، فعلاً خالی است (این فایل معمولاً شامل مخازنی از کد و توضیحات مربوط‌ به تغییرات مدل می‌شود).

دیپ‌سیک V3، مدل زبانی بزرگ متن‌باز، زمستان سال گذشته در دسترس قرار گرفت و قلب تپنده‌ی دیپ‌سیک R1 به‌حساب می‌آید (R1 مدلی استدلالی است که دیپ‌سیک را بر سر زبان‌ها انداخت و حواشی گسترده‌ای را ایجاد کرد).

دیپ‌سیک V3 مدلی همه‌منظوره است که به‌طور خاص برای وظایف استدلالی بهینه نشده است، بااین‌حال می‌تواند مسائل ریاضی را حل کند و کد بنویسد.

تا به امروز، مدل V3 تحت یک مجوز سفارشی متن‌باز در دسترس بود؛ بااین‌حال به‌لطف تغییرات جدید، مدل قدرتمند دیپ‌سیک از این پس تحت مجوز MIT ارائه می‌شود. بدین ترتیب توسعه‌دهندگان می‌توانند بدون هیچ‌ محدودیتی، از این مدل هوش مصنوعی در پروژه‌های تجاری استفاده کنند و حتی سراغ اصلاح‌کردنش بروند.

کارشناسان می‌گویند مدل جدید دیپ‌سیک قدرتمندتر از نمونه‌ی قبلی شده است و منابع سخت‌افزاری کمتری را درگیر می‌کند.

اکثر مدل‌های زبانی بزرگ و پیشرفته، صرفاً با کارت‌های گرافیک کلاس دیتاسنتر پتانسیل اصلی خودشان را به‌نمایش می‌گذارند. اونی هانون، دانشمند تحقیقاتی تیم یادگیری ماشین اپل، می‌گوید که نسخه‌ی جدید دیپ‌سیک V3 را روی مک استودیو اجرا کرده و این مدل توانسته است در هر ثانیه تقریباً ۲۰ توکن خروجی ارائه دهد که بسیار قابل توجه به نظر می‌رسد.

مک استودیو مورد استفاده، قوی‌ترین نمونه‌ی آن کامپیوتر بود و درحال‌حاضر حدود ۹٬۵۰۰ دلار قیمت دارد. دانشمند اپل می‌گوید اجرای دیپ‌سیک روی مک استودیو نیازمند یک‌سری تکنیک خاص ازجمله کوانتش چهار بیتی بود. این تکنیک که برای بهینه‌سازی مدل‌های زبانی بزرگ استفاده می‌شود، میزان درگیرشدن حافظه را کم می‌کند و تأخیر را پایین می‌آورد، اما بهای استفاده از آن، کاهش دقت خروجی است.

ظاهراً نسخه‌ی جدید دیپ‌سیک V3 در زمینه‌ی کدنویسی عملکرد بهتری نسبت‌ به مدل قبلی دارد. بر اساس یک تست غیررسمی و مستقل، دیپ‌سیک V3 جدید به امتیاز ۶۰ درصد در بنچمارک دست پیدا کرد که چند درصد بهتر از نسخه‌ی قبلی است. البته دیپ‌سیک V3 جدید ضعیف‌تر از مدل استدلالی Qwen-32B ظاهر شد. V3 با وجود تمامی بهبودهایش همچنان در پشت سر مدل پرچمدار R1 قرار می‌گیرد.

مدل زبانی دیپ‌سیک V3 شامل ۶۷۱ میلیارد پارامتر است، اما به هنگام پاسخ به پرسش‌ها تنها ۳۷ میلیارد از آن‌ها را استفاده می‌کند. این ساختار غیرمنتظره، به دیپ‌سیک V3 امکان می‌دهد که عملکرد مناسب را با منابع سخت‌افزاری کمتر از سایر مدل‌های زبانی ارائه دهد (مدل‌های دیگر معمولاً تمامی پارامترهایشان را فعال می‌کنند).

دیپ‌سیک می‌گوید V3 بهینه‌تر از R1 است و هزینه‌های نهایی سازمان‌ها را پایین‌تر می‌آورد. نسخه‌ی اولیه‌ی دیپ‌سیک V3 بر پایه‌ی دیتاستی از ۱۴٫۸ تریلیون توکن آموزش داده شد.

مقاله رو دوست داشتی؟
نظرت چیه؟
تبلیغات
D5-b3IranServer
داغ‌ترین مطالب روز
بهترین گوشی‌های گیمینگ بازار ایران
بهترین گوشی مناسب برای بازی [اردیبهشت ۱۴۰۴]

اگر به‌‌دنبال گوشی هوشمند برای بازی می‌گردید، نیاز نیست حساب بانکی‌تان را خالی کنید. در این مقاله بهترین گوشی‌های گیمینگ بازار ایران را معرفی ...

882
17 ساعت پیش
بهترین گوشی های سامسونگ از نظر دوربین
بهترین گوشی سامسونگ ازنظر دوربین [اردیبهشت ۱۴۰۴]

اگر قصد دارید یکی از گوشی‌های سامسونگ را برای عکاسی بخرید، در این مقاله با بهترین گوشی‌های سامسونگ ازنظر دوربین براساس قیمت‌های مختلف آشنا خواهید شد.

119
15 ساعت پیش
طرحی از کامپیوتر کوانتومی IQM درکنار نماد‌های موسیقی
به اولین موسیقی کوانتومی جهان گوش کنید؛ آیا این آهنگ، صدای آینده است؟

«Recurse» اولین آهنگ دنیاست که نت‌هایش از هم‌نوایی شگفت‌انگیز انسان، هوش مصنوعی و قدرت پردازش کامپیوتر کوانتومی شکل گرفته است.

148
2 روز پیش
بهترین شغل های ۱۰ سال آینده ایران
بهترین شغل های ۱۰ سال آینده ایران را از الان بشناسید

در این مقاله با نگاهی به روند تکنولوژی به بررسی مشاغلی می‌پردازیم که طی ۱۰ سال آینده در ایران بیشترین رشد و فرصت شغلی را خواهند داشت.

51
2 روز پیش
راهنمای خرید بهترین سشوار خانگی، چرخشی و حرفه‌ای در رده٬های مختلف
بهترین سشوارهای بازار از برندهای بابیلیس تا دایسون [بهار و تابستان ۱۴۰۴]

برای خرید بهترین سشوار خانگی، حرفه‌ای و چرخشی به چه نکاتی باید توجه کرد؟ بهترین برند سشوار کدام است؟ با راهنمای خرید بهترین سشوارها همراه زومیت ...

39
2 روز پیش
تخم بوقلمون
تخم مرغ همه جا هست؛ اما چرا تخم بوقلمون نمی‌خوریم؟

درحالی‌که همه ما احتمالاً تجربه خوردن تخم بلدرچین، اردک و البته مرغ را داریم، اثری از تخم بوقلمون سر سفره‌های ما نیست. علت چیست؟

69
یک روز پیش
لوگو شیائومی / Xiaomi روی بدنه گوشی شیائومی 13T
اولین شاسی‌بلند شیائومی پنج‌شنبه به‌همراه تراشه Xring و گوشی 15s Pro رونمایی می‌شود

شیائومی ۱ خردادماه با برگزاری مراسمی ویژه از اولین شاسی‌بلند خود در کنار چند محصول مهم دیگر رونمایی خواهد کرد.

57
2 روز پیش
تبلیغات
DN-DNShatel

نظرات

با چشم باز خرید کنید
زومیت شما را برای انتخاب بهتر و خرید ارزان‌تر راهنمایی می‌کند
ورود به بخش محصولات