D1-kifpool

نخستین مدل هوش مصنوعی باز متا با قابلیت پردازش متن و تصویر معرفی شد

پنج‌شنبه ۵ مهر ۱۴۰۳ - ۰۸:۰۸
مطالعه 4 دقیقه
لوگو Meta AI روی نمایشگر گوشی قرار گرفته روی کیبورد لپ‌تاپ از نمای نزدیک
متا از مدل هوش مصنوعی لاما ۳٫۲ که علاوه‌بر قابلیت پردازش متن، توانایی پردازش تصاویر را نیز دارد رونمایی کرد.
تبلیغات
D4-mcid4

متا از مدل هوش مصنوعی لاما ۳٫۲ (Llama 3.2) رونمایی کرد؛ این مدل متن‌باز اولین مدل متا است که می‌تواند هم تصاویر و هم متون را پردازش کند. عرضه‌ی این نسخه گامی مهم در پیشرفت توانایی‌های هوش مصنوعی متا به‌شمار می‌رود و می‌تواند به توسعه‌دهندگان کمک کند تا برنامه‌های پیشرفته‌تری در زمینه‌ی واقعیت افزوده، جستجوی بصری و تحلیل اسناد ایجاد کنند.

پوستر معرفی مدل‌های لاما ۳٫۲
Meta

طبق بیانیه‌ی متا، لاما ۳٫۲ شامل دو مدل بینایی (با ۱۱ میلیارد و ۹۰ میلیارد پارامتر) و همچنین دو مدل سبک‌تر مخصوص متن (با ۱ میلیارد و ۳ میلیارد پارامتر) است. مدل‌های کوچک‌تر برای کار روی دستگاه‌های موبایل و سخت‌افزارهای شرکت‌هایی چون Qualcomm و MediaTek طراحی شده‌اند. به‌طور خاص، این مدل‌های سبک از طول زمینه (Context) ۱۲۸ هزار توکن پشتیبانی می‌کنند.

ارزیابی‌های داخلی متا نشان می‌دهند که مدل‌های بینایی لاما ۳٫۲ توانایی رقابت با مدل‌های شناخته‌شده‌ای مانند Claude 3 Haiku و GPT4o-mini در وظایف تشخیص تصویر و درک بصری را دارند. گفته می‌شود که مدل ۳ میلیارد پارامتری متا از مدل Gemma 2 2.6B و Phi 3.5-mini در وظایفی مانند پیروی از دستورات، خلاصه‌سازی و استفاده از ابزارها بهتر عمل می‌کند، درحالی‌که مدل یک میلیارد پارامتری عملکردی شبیه به مدل Gemma دارد.

مقایسه بنچمارک‌ بصری مدل‌های هوش مصنوعی مختلف
مقایسه‌ی بنچمارک‌ بصری و متنی مدل لاما ۳٫۲ با دیگر مدل‌ها
Meta
مقایسه بنچمارک‌ دستورات سبک مدل‌های هوش مصنوعی مختلف
مقایسه‌ی بنچمارک‌های سبک پیروی از دستورات مدل لاما ۳٫۲ با دیگر مدل‌ها
Meta

قابلیت‌های چندحالته‌ی جدید به لاما ۳٫۲ این امکان را می‌دهد که وظایفی مانند درک اسناد در سطح نمودارها و جداول، نوشتن توضیحات تصاویر و تطبیق بصری (Visual Grounding) را انجام دهد. به عنوان مثال، این مدل می‌تواند با تحلیل یک نمودار تجاری، به سوالاتی در مورد عملکرد فروش پاسخ یا پس از تفسیر نقشه‌ها، اطلاعاتی درباره‌ی مسیرهای پیاده‌روی ارائه دهد.

متا بر سادگی پیاده‌سازی مدل‌های جدید خود برای توسعه‌دهندگان تأکید دارد. به‌گفته‌ی احمد الدحله، قائم مقام کسب‌و‌کار هوش مصنوعی و یادگیری ماشین متا، توسعه‌دهندگان برای فعال کردن قابلیت پردازش تصویر، تنها باید ویژگی چندحالته‌ی جدید را اضافه کنند.

متا با معرفی مدل‌های جدید خود به دور رقابت با OpenAI و گوگل که سال گذشته مدل‌های چندحالته‌ی خود را معرفی کرده بودند باز می‌گردد؛ افزون‌بر‌این، مدل‌های جدید نقش مهمی در استراتژی کلی هوش مصنوعی متا ایفا می‌کنند. اضافه شدن قابلیت‌های بصری برای پروژه‌های سخت‌افزاری متا، از جمله عینک‌های Ray-Ban Meta، نیز اهمیت ویژه‌ای دارد.

متا با هدف ساده‌‌کردن پیاده‌سازی مدل‌های لاما در سناریو‌های مختلفی چون زیرساخت سنتی (On Premise)، کلود و آن‌دیوایس (On Device)، توزیع‌های Llama Stack را منتشر می‌کند. این توزیع‌ها شامل یک رابط خط فرمان، کدهای کلاینت در زبان‌های برنامه‌نویسی مختلف و کانتینرهای Docker برای پیاده‌سازی سرورها و ایجنت‌ها هستند.

نمودار توزیع‌های لاما استک
توزیع‌های لاما استک
Meta

افزون‌برعرضه‌ی مدل‌های جدید، متا تدابیر ایمنی جدیدی برای مدل‌های هوش مصنوعی خود معرفی کرده است. از جمله‌ی این تدابیر می‌توان به Llama Guard 3 11B Vision برای فیلتر کردن ورودی‌ها و خروجی‌های متنی و تصویری و نسخه‌ی بهینه‌تری از Llama Guard برای استفاده‌ی آن‌ دیوایس اشاره کرد.

متا همچنان به حمایت از توسعه‌ی هوش مصنوعی متن‌باز ادامه می‌دهد و بر این باور است که این رویکرد باعث نوآوری و دموکراتیزه شدن دسترسی به فناوری هوش مصنوعی می‌شود. مدل‌های لاما ۳٫۲ برای دانلود در وب‌سایت llama.com و Hugging Face و همچنین از طریق پلتفرم‌های مختلف دردسترس هستند.

لازم‌به‌ذکر است که نسخه‌ی قبلی لاما ۳٫۱ که شامل نسخه‌ای با ۴۰۵ میلیارد پارامتر است، همچنان برای وظایف پیشرفته‌تر تولید متن کاربرد دارد.

مقاله رو دوست داشتی؟
نظرت چیه؟
تبلیغات
D5-b3IranServer
داغ‌ترین مطالب روز
بهترین گوشی‌های میان‌رده سامسونگ
بهترین گوشی میان رده سامسونگ [اردیبهشت ۱۴۰۴]

در مقاله‌ی پیش‌‌رو با در نظر گرفتن امکانات مناسب در مقابل قیمت مقرون‌به‌صرفه، بهترین گوشی‌های میان‌رده‌ی سامسونگ را معرفی می‌کنیم.

141
یک روز پیش
نمایشگر شیائومی ۱۳ اولترا
با این ۳ روش‌ گوشی شیائومی را به تلویزیون وصل کنید

روش وصل کردن گوشی شیائومی به تلویزیون به‌صورت بی‌سیم و باسیم انجام می‌شود که در ادامه آن را آموزش می‌دهیم.

30
21 ساعت پیش
سیاهدانه
سیاه‌دانه چه خواصی دارد و چه کسانی نباید آن را مصرف کنند؟

سیاه دانه قرن‌ها است که در اشکال مختلف طب سنتی استفاده می‌شود و برخی آن را مهم‌ترین گیاه دارویی تاریخ می‌دانند. با خواص سیاه دانه آشنا شوید.

13
19 ساعت پیش
بهترین گوشی‌های سامسونگ در بازار ایران
بهترین گوشی های سامسونگ [اردیبهشت ۱۴۰۴]

ارزان‌ترین گوشی سامسونگ و بهترین گوشی سامسونگ از نظر دوربین، پردازنده و باتری کدام است؟ با راهنمای خرید بهترین گوشی سامسونگ همراه زومیت باشید.

439
یک روز پیش
بهترین گوشی های شیائومی برای عکاسی
بهترین گوشی های شیائومی از نظر دوربین [اردیبهشت ۱۴۰۴]

برای بسیاری از کاربران دوربین گوشی مهم‌ترین بخش آن محسوب می‌شود؛ اما کدامیک از مدل‌های شیائومی بهترین دوربین را در بازه‌های قیمتی مختلف دارند؟

83
18 ساعت پیش
بهترین گوشی های سامسونگ از نظر دوربین
بهترین گوشی سامسونگ ازنظر دوربین [اردیبهشت ۱۴۰۴]

اگر قصد دارید یکی از گوشی‌های سامسونگ را برای عکاسی بخرید، در این مقاله با بهترین گوشی‌های سامسونگ ازنظر دوربین براساس قیمت‌های مختلف آشنا خواهید شد.

122
2 روز پیش
بهترین گوشی‌های گیمینگ بازار ایران
بهترین گوشی مناسب برای بازی [اردیبهشت ۱۴۰۴]

اگر به‌‌دنبال گوشی هوشمند برای بازی می‌گردید، نیاز نیست حساب بانکی‌تان را خالی کنید. در این مقاله بهترین گوشی‌های گیمینگ بازار ایران را معرفی ...

889
2 روز پیش
تبلیغات
DN-DNShatel

نظرات

با چشم باز خرید کنید
زومیت شما را برای انتخاب بهتر و خرید ارزان‌تر راهنمایی می‌کند
ورود به بخش محصولات