D1-lg

هوش مصنوعی جدید DeepSeek متن‌باز است و عملکردی هم‌سطح o1 دارد

سه‌شنبه 2 بهمن 1403 - 12:55
مطالعه 3 دقیقه
لوگوی دیپ‌سیک با پس‌زمینه‌ی لانه‌زنبوری
هوش مصنوعی جدید استارتاپ DeepSeek با عملکردی برابر با مدل o1 شرکت OpenAI و به‌صورت متن‌باز معرفی شد.
تبلیغات
D4-mcid4

استارتاپ هوش مصنوعی چینی DeepSeek که به‌دلیل به چالش کشیدن ارائه‌دهندگان پیشرو هوش مصنوعی با فناوری‌های متن‌باز شناخته می‌شود، مدل زبانی بزرگ (LLM) استدلالی متن‌باز جدیدی به نام DeepSeek-R1 معرفی کرد.

DeepSeek ادعا می‌کند که مدل R1 که بر اساس مدل ترکیبی DeepSeek V3 ساخته شده است، در وظایف ریاضی، کدنویسی و استدلال، با مدل o1 شرکت OpenAI، عملکردی برابر دارد؛ درحالی‌که به‌دلیل متن‌باز بودن و هزینه‌های محاسباتی کمتر، ۹۰ تا ۹۵ درصد مقرون‌به‌صرفه‌تر از مدل OpenAI ظاهر می‌شود.

هوش مصنوعی R1 نشان می‌دهد که مدل‌های متن‌باز در رقابت برای دستیابی به هوش مصنوعی انسان‌گونه (AGI)، بیش از پیش فاصله‌ی خود را با مدل‌های تجاریِ بسته کم می‌کنند. DeepSeek برای نشان‌دادن توانایی مدل جدیدش از R1 برای پالایش ۶ مدل Llama و Qwen استفاده کرد و عملکرد آن‌ها را به سطوح جدیدی رساند. در یک مورد، نسخه‌ی پالایش‌شده‌ی Qwen-1.5B در بنچمارک‌های ریاضی منتخب، از مدل‌های بسیار بزرگ‌تر، GPT-4o و Claude 3.5 Sonnet، عملکرد بهتری داشت.

«پالایش» در حوزه‌ی هوش مصنوعی به فرایندی گفته می‌شود که در آن یک مدل بزرگ و پیچیده (مانند R1) برای آموزش یک مدل کوچک‌تر و ساده‌تر استفاده می‌شود. هدف این است که مدل کوچک‌تر بتواند با استفاده از دانش و توانایی‌های مدل بزرگ‌تر، عملکرد بهتری داشته باشد.

تمرکز شرکت‌ها به‌طور فزاینده‌ای بر هوش مصنوعی انسان‌گونه معطوف شده است؛ سطحی از هوش مصنوعی که می‌تواند وظایف فکری را مانند انسان انجام دهد. بسیاری از تیم‌ها تلاش خود را برای بهبود قابلیت‌های استدلال مدل‌ها دوچندان کرده‌اند.

OpenAI اولین حرکت قابل توجه را در حوزه‌ی AGI با مدل o1 انجام داد که از فرایند استدلال زنجیره‌ای برای حل مسئله استفاده می‌کند. از طریق RL (یادگیری تقویتی، یا بهینه‌سازی مبتنی‌بر پاداش)، o1 یاد می‌گیرد که زنجیره‌ی تفکر خود را تقویت کند، استراتژی‌هایی را که استفاده می‌کند، اصلاح کند و در نهایت یاد می‌گیرد که اشتباهات خود را تشخیص دهد و اصلاح کند یا زمانی که رویکردهای فعلی کار نمی‌کنند، رویکردهای جدید امتحان کند.

R1 ترکیبی از یادگیری تقویتی (RL) و تنظیم دقیق نظارت‌شده (supervised fine-tuning) برای انجام وظایف استدلالی پیچیده و مطابقت با عملکرد o1 استفاده می‌کند.

DeepSeek-R1 به‌عنوان نسخه‌ای بهبودیافته از DeepSeek-R1-Zero توسعه داده شده؛ مدلی پیشگام که صرفاً با یادگیری تقویتی آموزش دیده است.

هنگامی که DeepSeek-R1 آزمایش شد، در آزمون‌های ریاضی AIME 2024 امتیاز ۷۹٫۸ درصد و در MATH-500 امتیاز ۹۷٫۳ درصد را کسب کرد و در Codeforces به رتبه‌ی ۲۰۲۹ دست یافت که بهتر از ۹۶٫۳ درصد از برنامه‌نویسان انسانی است. در مقابل، o1-1217 در این بنچمارک‌ها به‌ترتیب امتیازهای ۷۹٫۲ درصد، ۹۶٫۴ درصد و ۹۶٫۶ درصد را به‌دست آورد.

افزون‌‌بر عملکرد بهبودیافته‌ای که تقریباً با مدل o1 در بنچمارک‌ها برابری می‌کند، DeepSeek-R1 جدید بسیار مقرون‌به‌صرفه‌تر ظاهر می‌شود. درحالی‌که مدل o1 برای هر میلیون توکن ورودی ۱۵ دلار و برای هر میلیون توکن خروجی ۶۰ دلار هزینه دارد، DeepSeek Reasoner که مبتنی‌بر مدل R1 است، برای هر میلیون توکن ورودی ۰٫۵۵ دلار و برای هر میلیون توکن خروجی ۲٫۱۹ دلار هزینه دارد.

هوش مصنوعی جدید DeesSeek را می‌توان با نام DeepThink در پلتفرم چت DeepSeek، که مشابه ChatGPT است، آزمایش کرد. کاربران علاقه‌مند می‌توانند از طریق Hugging Face، تحت مجوز MIT، به وزن‌های مدل و منبع کدها دسترسی داشته باشند یا می‌توانند برای ادغام مستقیم از API استفاده کنند.

مقاله رو دوست داشتی؟
نظرت چیه؟
تبلیغات
D5-b3IranServer
داغ‌ترین مطالب روز
بهترین اپلیکیشن های مسیریابی
بهترین اپلیکیشن های مسیریابی ایرانی و خارجی ۱۴۰۴

با معرفی بهترین اپ‌های مسیریابی برای آیفون و اندروید و همچنین بهترین گزینه برای مسیریابی آفلاین، به شما در پیدا کردن مسیر و مقصدتان کمک خواهیم کرد.

31
حدود 8 ساعت قبل
یک هکر با لباس سیاه در اتاقی با نور قرمز مقابل مانیتور
هکر ۱۳ ساله‌ یکی از بزرگ‌ترین شرکت‌های جهان را شگفت‌زده کرد!

هکری بااستعداد که دوران نوجوانی خود را سپری می‌کند، از همین‌حالا، یکی از بزرگ‌ترین شرکت‌های جهان را شگفت‌زده کرده است.

79
1 روز قبل
طراحی ماژول دوربین گلکسی S24 FE
یکی از گوشی‌های محبوب سامسونگ به‌زودی آپدیت بزرگی دریافت می‌کند

سامسونگ درحال آزمایش آپدیتی بزرگ برای یکی از گوشی‌های بالارده‌ی خودش است.

53
1 روز قبل
چهره‌ی یک مرد میان‌سال با پیراهن سفید و کت مشکی
صداپیشه GTA در سن ۶۷ سالگی درگذشت

صداپیشه‌ی یکی از شخصیت‌های معروف بازی GTA در سن ۶۷ سالگی از دنیا رفت.

31
حدود 16 ساعت قبل
ایتان گائو خلبان ۱۹ ساله در هواپیما
بازداشت خلبان ۱۹ ساله در قطب جنوب، سروصدای زیادی به پا کرد

جسارت خلبان جوان در عبور از مرزهای جنوبگان، پای قانون را وسط کشید و سرنوشت سفر او را به بن‌بست رساند.

22
حدود 8 ساعت قبل
نمای سه‌چهارم جلو خودرو نیسان ماکسیما ۲۰۱۹
خودرویی که ۲ سال پیش از خط تولید خارج شد، همچنان فروخته می‌شود

ماکسیما سدان ارزشمند نیسان است که تولیدش دو سال پیش متوقف شد؛ اما هنوز نمونه‌های صفرکیلومترش به فروش می‌رسد.

9
1 روز قبل
کیا اسپورتیج ۲۰۲۵
قیمت کیا اسپورتیج ۲۰۲۶ افزایش یافت

کیا قیمت مدل ۲۰۲۶ شاسی‌بلند جمع‌وجور اسپورتیج را اعلام کرد.

13
1 روز قبل
تبلیغات
DN-DNShatel

نظرات

با چشم باز خرید کنید
زومیت شما را برای انتخاب بهتر و خرید ارزان‌تر راهنمایی می‌کند
ورود به بخش محصولات