متاهوش مصنوعی

رونمایی متا از نسل جدید مدل‌های پرچم‌دار هوش مصنوعی Llama 4

شرکت متا در یک حرکت کم‌سابقه و در روز شنبه، نسل جدیدی از مدل‌های هوش مصنوعی خود موسوم به Llama 4 را معرفی کرد. این مجموعه شامل سه مدل اصلی به نام‌های Llama 4 Scout، Maverick و Behemoth  است. به گفته متا، این مدل‌ها با استفاده از حجم عظیمی از داده‌های متنی، تصویری و ویدیویی بدون برچسب، آموزش دیده‌اند و توانایی درک چندوجهی را به شکل قابل توجهی ارتقا داده‌اند.

دسترسی گسترده و جهش در توان پردازش

مدل‌های Scout و Maverick به‌طور عمومی از طریق وب‌سایت llama.com و پلتفرم‌های شریک متا مانند Hugging Face در دسترس هستند، در حالی که Behemoth هنوز در حال آموزش است. متا اعلام کرده که دستیار هوش مصنوعی‌اش، Meta AI، اکنون در اپلیکیشن‌هایی مانند واتساپ، اینستاگرام و مسنجر و در ۴۰ کشور، با مدل Llama 4 به‌روزرسانی شده است. البته قابلیت‌های چندحالته فعلاً فقط در ایالات متحده و به زبان انگلیسی فعال هستند.

این مدل‌ها نخستین نسل از خانواده Llama هستند که از طراحی Mixture of Experts (MoE)  بهره می‌برند؛ سبکی از طراحی که با تقسیم وظایف به مدل‌های کوچک‌تر و تخصصی، بهره‌وری پردازشی را به‌طور چشمگیری بهبود می‌بخشد. مثلاً مدل Maverick با اینکه ۴۰۰ میلیارد پارامتر دارد، فقط ۱۷ میلیارد از آن‌ها هنگام اجرا فعال هستند. مدل Scout هم ۱۷ میلیارد پارامتر فعال دارد که بین ۱۶ بخش تخصصی پردازش تقسیم می‌شود، در حالی که مجموع پارامترهایش ۱۰۹ میلیارد است.

از نظر کاربرد، Maverick  برای وظایف گفت‌وگومحور و نگارش خلاقانه طراحی شده و طبق تست‌های داخلی متا، در برخی آزمون‌های سنجش عملکرد (بنچمارک‌ها) از مدل‌هایی مانند GPT-4o و Gemini 2.0 بهتر عمل کرده است. هرچند که هنوز در رقابت با مدل‌های پیشرفته‌تری همچون GPT-4.5 یا Claude 3.7 Sonnet عقب‌تر است. در مقابل، Scout با داشتن پنجره زمینه‌ای بسیار بزرگ به اندازه ۱۰ میلیون توکن، برای پردازش متن‌های طولانی و کدهای پیچیده گزینه‌ای مناسب است.

مدل Behemoth که در حال حاضر منتشر نشده، طبق اعلام متا دارای ۲۸۸ میلیارد پارامتر فعال و در مجموع نزدیک به دو تریلیون پارامتر است. متا ادعا می‌کند این مدل در برخی تست‌های مهارت‌های STEM مانند حل مسائل ریاضی، از مدل‌های رقیب همچون GPT-4.5 و Claude 3.7 عملکرد بهتری دارد

محدودیت مجوز و تلاش برای بی‌طرفی

اما یکی از نقاط بحث‌برانگیز Llama 4 مربوط به مجوز استفاده از آن است. بر اساس این مجوز، کاربران یا شرکت‌هایی که در اتحادیه اروپا مستقر هستند، حق استفاده یا توزیع این مدل‌ها را ندارند. همچنین شرکت‌هایی با بیش از ۷۰۰ میلیون کاربر فعال ماهانه باید برای استفاده از Llama 4 مجوز ویژه‌ای از متا دریافت کنند.

متا همچنین اعلام کرده که مدل‌های Llama 4 اکنون با دیدگاه بازتری به سؤالات «بحث‌برانگیز» پاسخ می‌دهند و دیگر مانند نسخه‌های قبلی، به‌طور خودکار از پاسخ دادن به این‌گونه موضوعات خودداری نمی‌کند. به گفته سخنگوی شرکت، این مدل‌ها طراحی شده‌اند تا پاسخ‌هایی واقعی، کمک‌کننده و بدون قضاوت ارائه دهند و دیدگاه‌های مختلف را به رسمیت بشناسند.

این تغییرات در حالی صورت می‌گیرد که برخی چهره‌های سیاسی نزدیک به دونالد ترامپ، مانند ایلان ماسک و دیوید سکس، چت‌بات‌های هوش مصنوعی را به سوگیری سیاسی و سانسور دیدگاه‌های محافظه‌کارانه متهم کرده‌اند. متا با Llama 4 تلاش دارد تا با کاهش جانبداری و افزایش انعطاف در پاسخ‌گویی، به انتقادات مربوط به «بیداری سیاسی» در هوش مصنوعی پاسخ دهد.

نوشته های مشابه

دکمه بازگشت به بالا