متا مدلهای Llama 4 را معرفی کرد: نسل جدیدی از مدلهای پیشرفته هوش مصنوعی

Meta مجموعهای جدید از مدلهای هوش مصنوعی خود را با نام Llama 4 منتشر کرده است. این مجموعه شامل چهار مدل جدید است: Llama 4 Scout، Llama 4 Maverick و Llama 4 Behemoth. این مدلها با استفاده از دادههای متنی، تصویری و ویدیویی بیبرچسب بهطور گسترده آموزش دیدهاند تا توانایی درک بصری وسیعی پیدا کنند.
انتشار این مدلها پس از موفقیت مدلهای متنباز از آزمایشگاه DeepSeek در چین که عملکردی مشابه یا بهتر از مدلهای قبلی Llama داشتند، شدت گرفته است. گفته میشود که Meta بهطور جدی روی توسعه Llama 4 کار کرده است تا هزینههای اجرایی و پیادهسازی مدلها را کاهش دهد.
مدلهای Scout و Maverick بهطور عمومی در دسترس هستند و میتوان آنها را از وبسایت Llama.com یا از طریق پلتفرمهای شریک Meta مانند Hugging Face دانلود کرد. در حالی که مدل Behemoth هنوز در حال آموزش است. Meta اعلام کرده که Meta AI، دستیار هوش مصنوعی خود که در اپلیکیشنهای مختلف مانند WhatsApp، Messenger و Instagram استفاده میشود، اکنون از مدلهای Llama 4 در ۴۰ کشور بهره میبرد. اما ویژگیهای چندرسانهای در حال حاضر فقط برای کاربران انگلیسیزبان در ایالات متحده در دسترس است.
مجوز و محدودیتهای مدلهای Llama 4
برخی از توسعهدهندگان ممکن است با مجوز مدلهای Llama 4 مشکل داشته باشند. کاربران و شرکتهایی که در اتحادیه اروپا مستقر هستند، از استفاده و توزیع این مدلها منع شدهاند. این موضوع به احتمال زیاد بهدلیل قوانین حاکم بر حریم خصوصی و دادهها در این منطقه است. علاوه بر این، همانند نسخههای قبلی Llama، شرکتهایی که بیش از ۷۰۰ میلیون کاربر فعال ماهانه دارند، باید برای دریافت مجوز خاص از Meta درخواست دهند.
معماری Mixture of Experts (MoE) و ویژگیهای مدلها
Llama 4 اولین گروه از مدلهای Meta است که از معماری Mixture of Experts (MoE) بهره میبرد. این معماری بهطور موثرتری دادهها را پردازش کرده و به سوالات پاسخ میدهد. معماری MoE بهاینصورت عمل میکند که وظایف پردازش دادهها را به زیرمجموعههای کوچکتر تقسیم کرده و آنها را به مدلهای متخصص واگذار میکند.
برای مثال، مدل Maverick دارای ۴۰۰ میلیارد پارامتر است که تنها ۱۷ میلیارد پارامتر فعال دارد و از ۱۲۸ “متخصص” استفاده میکند. Scout نیز ۱۷ میلیارد پارامتر فعال دارد و از ۱۶ متخصص استفاده میکند.
طبق آزمایشهای داخلی Meta، مدل Maverick که برای استفاده در دستیارهای عمومی و چت مناسب است، در برخی ارزیابیها از جمله کدنویسی، استدلال، چندزبانه و پردازش تصاویر، از مدلهایی مانند GPT-4 و Google Gemini 2.0 بهتر عمل کرده است. اما در مقایسه با مدلهای جدیدتر مانند Google Gemini 2.5 Pro و GPT-4.5، نتایج آن کمی ضعیفتر است.
مدل Scout در وظایفی مانند خلاصهسازی اسناد و استدلال بر روی کدهای بزرگ بهتر عمل میکند. این مدل میتواند تصاویر و متونی تا ۱۰ میلیون توکن را پردازش کند که به آن این امکان را میدهد تا با اسناد بسیار طولانی کار کند.
Behemoth و عملکردهای آن
مدل Behemoth که هنوز منتشر نشده، به سختافزار قدرتمندتری نیاز دارد. این مدل دارای ۲۸۸ میلیارد پارامتر فعال و ۲ تریلیون پارامتر کل است و در برخی ارزیابیها، از مدلهای GPT-4.5 و Claude 3.7 Sonnet بهتر عمل میکند.
تغییرات در سیاستهای پاسخدهی Llama 4
یکی از تغییرات جالب در مدلهای Llama 4 این است که این مدلها بهطور قابل توجهی پاسخ به سؤالات “جنجالی” را کمتر رد میکنند. طبق گفته Meta، مدلهای Llama 4 به سؤالات سیاسی و اجتماعی که مدلهای قبلی از پاسخ به آنها خودداری میکردند، پاسخ میدهند. این مدلها همچنین بهطور کلی از نظر رویکرد به سؤالات، بیطرفتر عمل میکنند و تمایل کمتری به رد کردن سؤالات بر اساس دیدگاههای خاص دارند.
این تغییرات ممکن است بهدلیل انتقادهایی باشد که به برخی از چتباتهای هوش مصنوعی بهخصوص در زمینه مسائل سیاسی وارد شده است. برخی از منتقدان از جمله نزدیکان دونالد ترامپ، معتقدند که مدلهای هوش مصنوعی به دلیل نگرشهای سیاسی خاص خود، برخی از دیدگاهها را سانسور میکنند.
دیدگاهتان را بنویسید