رونمایی متا از نسل جدید مدلهای پرچمدار هوش مصنوعی Llama 4
شرکت متا در یک حرکت کمسابقه و در روز شنبه، نسل جدیدی از مدلهای هوش مصنوعی خود موسوم به Llama 4 را معرفی کرد. این مجموعه شامل سه مدل اصلی به نامهای Llama 4 Scout، Maverick و Behemoth است. به گفته متا، این مدلها با استفاده از حجم عظیمی از دادههای متنی، تصویری و ویدیویی بدون برچسب، آموزش دیدهاند و توانایی درک چندوجهی را به شکل قابل توجهی ارتقا دادهاند.
دسترسی گسترده و جهش در توان پردازش
مدلهای Scout و Maverick بهطور عمومی از طریق وبسایت llama.com و پلتفرمهای شریک متا مانند Hugging Face در دسترس هستند، در حالی که Behemoth هنوز در حال آموزش است. متا اعلام کرده که دستیار هوش مصنوعیاش، Meta AI، اکنون در اپلیکیشنهایی مانند واتساپ، اینستاگرام و مسنجر و در ۴۰ کشور، با مدل Llama 4 بهروزرسانی شده است. البته قابلیتهای چندحالته فعلاً فقط در ایالات متحده و به زبان انگلیسی فعال هستند.
این مدلها نخستین نسل از خانواده Llama هستند که از طراحی Mixture of Experts (MoE) بهره میبرند؛ سبکی از طراحی که با تقسیم وظایف به مدلهای کوچکتر و تخصصی، بهرهوری پردازشی را بهطور چشمگیری بهبود میبخشد. مثلاً مدل Maverick با اینکه ۴۰۰ میلیارد پارامتر دارد، فقط ۱۷ میلیارد از آنها هنگام اجرا فعال هستند. مدل Scout هم ۱۷ میلیارد پارامتر فعال دارد که بین ۱۶ بخش تخصصی پردازش تقسیم میشود، در حالی که مجموع پارامترهایش ۱۰۹ میلیارد است.
از نظر کاربرد، Maverick برای وظایف گفتوگومحور و نگارش خلاقانه طراحی شده و طبق تستهای داخلی متا، در برخی آزمونهای سنجش عملکرد (بنچمارکها) از مدلهایی مانند GPT-4o و Gemini 2.0 بهتر عمل کرده است. هرچند که هنوز در رقابت با مدلهای پیشرفتهتری همچون GPT-4.5 یا Claude 3.7 Sonnet عقبتر است. در مقابل، Scout با داشتن پنجره زمینهای بسیار بزرگ به اندازه ۱۰ میلیون توکن، برای پردازش متنهای طولانی و کدهای پیچیده گزینهای مناسب است.
مدل Behemoth که در حال حاضر منتشر نشده، طبق اعلام متا دارای ۲۸۸ میلیارد پارامتر فعال و در مجموع نزدیک به دو تریلیون پارامتر است. متا ادعا میکند این مدل در برخی تستهای مهارتهای STEM مانند حل مسائل ریاضی، از مدلهای رقیب همچون GPT-4.5 و Claude 3.7 عملکرد بهتری دارد
محدودیت مجوز و تلاش برای بیطرفی
اما یکی از نقاط بحثبرانگیز Llama 4 مربوط به مجوز استفاده از آن است. بر اساس این مجوز، کاربران یا شرکتهایی که در اتحادیه اروپا مستقر هستند، حق استفاده یا توزیع این مدلها را ندارند. همچنین شرکتهایی با بیش از ۷۰۰ میلیون کاربر فعال ماهانه باید برای استفاده از Llama 4 مجوز ویژهای از متا دریافت کنند.
متا همچنین اعلام کرده که مدلهای Llama 4 اکنون با دیدگاه بازتری به سؤالات «بحثبرانگیز» پاسخ میدهند و دیگر مانند نسخههای قبلی، بهطور خودکار از پاسخ دادن به اینگونه موضوعات خودداری نمیکند. به گفته سخنگوی شرکت، این مدلها طراحی شدهاند تا پاسخهایی واقعی، کمککننده و بدون قضاوت ارائه دهند و دیدگاههای مختلف را به رسمیت بشناسند.
این تغییرات در حالی صورت میگیرد که برخی چهرههای سیاسی نزدیک به دونالد ترامپ، مانند ایلان ماسک و دیوید سکس، چتباتهای هوش مصنوعی را به سوگیری سیاسی و سانسور دیدگاههای محافظهکارانه متهم کردهاند. متا با Llama 4 تلاش دارد تا با کاهش جانبداری و افزایش انعطاف در پاسخگویی، به انتقادات مربوط به «بیداری سیاسی» در هوش مصنوعی پاسخ دهد.