جمنای قویترین مدل جهان – اپدیت ۵ اردیبهشت
جمنای قویترین مدل جهان
گوگل از جدیدترین دستاورد خود در عرصه هوش مصنوعی، مدل جمنای ۲.۵، رونمایی کرد. این مدل که پیشرفتهترین نمونه در نوع خود به شمار میرود، توانسته در ارزیابیهای تخصصی LMArena با اختلاف چشمگیری رتبه نخست را به خود اختصاص دهد.
بر اساس گزارشهای منتشر شده از سوی گوگل، مدلهای جمنای ۲.۵ با بهرهگیری از قابلیت “تفکر قبل از پاسخ”، عملکردی به مراتب دقیقتر و کارآمدتر در پردازش اطلاعات و استدلالهای پیچیده از خود نشان میدهند. این ویژگی، که فراتر از صرفاً طبقهبندی و پیشبینی دادهها است، به هوش مصنوعی امکان میدهد تا با تحلیل عمیقتر، استنتاج منطقی، در نظر گرفتن متن و جزئیات، تصمیمات آگاهانهتری اتخاذ کند.
گوگل با اشاره به تلاشهای پیشین خود در ارتقای هوش مصنوعی از طریق یادگیری تقویتی و روشهای زنجیره تفکر، اعلام کرد که جمنای ۲.۵ گامی نوین در این مسیر به شمار میرود. این مدل با ترکیب یک مدل پایه بهینهسازی شده و فرآیندهای پسآموزشی پیشرفته، به سطح جدیدی از عملکرد دست یافته است. این شرکت قصد دارد قابلیتهای تفکری مشابه را به طور مستقیم در تمامی مدلهای آینده خود ادغام کند تا امکان حل مسائل پیچیدهتر و پشتیبانی از عاملهای هوشمند آگاه به متن فراهم شود.
نسخه آزمایشی جمنای ۲.۵ پرو، به عنوان پیشرفتهترین مدل گوگل برای انجام وظایف پیچیده، هماکنون در پلتفرم Google AI Studio و برای کاربران Gemini Advanced در دسترس قرار گرفته است و به زودی از طریق Vertex AI نیز ارائه خواهد شد. این مدل در صدر جدول LMArena قرار دارد که نشاندهنده عملکرد قوی و سبک پاسخدهی باکیفیت آن از دیدگاه کاربران است. علاوه بر این، جمنای ۲.۵ پرو در زمینههای استدلال و برنامهنویسی نیز عملکرد چشمگیری داشته و در آزمونهای رایج برنامهنویسی، ریاضی و علوم پیشتاز است.
در بهروزرسانیهای تکمیلی، گوگل با ارائه نتایج ارزیابیهای MRCR (وضوح ارجاع چندگانه)، بر توانایی استدلال پیشرفته جمنای ۲.۵ پرو تأکید کرده است. این مدل بدون استفاده از تکنیکهای پرهزینه زمان آزمایش، در آزمونهای ریاضی و علوم نظیر GPQA و AIME 2025 نیز عملکرد برتری از خود نشان داده است. همچنین، در آزمون Humanity’s Last Exam که توسط متخصصان برای سنجش مرزهای دانش و استدلال انسانی طراحی شده، امتیاز قابل توجه ۱۸.۸ درصد را کسب کرده است.
در زمینه برنامهنویسی، جمنای ۲.۵ پیشرفت چشمگیری نسبت به نسخه ۲.۰ داشته و در ایجاد برنامههای کاربردی وب بصری و برنامههای کدنویسی عاملمحور، همچنین در تبدیل و ویرایش کد، عملکرد ممتازی را به نمایش گذاشته است. در آزمون SWE-Bench Verified، که استاندارد صنعت برای ارزیابی عاملهای کدنویسی است، جمنای ۲.۵ پرو با تنظیمات عامل سفارشی، امتیاز ۶۳.۸ درصد را کسب کرده است.
یکی از قابلیتهای برجسته جمنای ۲.۵ پرو، توانایی آن در ایجاد بازیهای ویدئویی از طریق تولید کد اجرایی تنها با یک دستور متنی است.
مدل جمنای ۲.۵ با بهرهگیری از ویژگیهای ممتاز نسلهای قبلی، از جمله قابلیت چندوجهی بودن ذاتی و پنجره متنی طولانی (در حال حاضر ۱ میلیون توکن و به زودی ۲ میلیون)، امکان درک مجموعههای داده وسیع و حل مسائل پیچیده از منابع اطلاعاتی مختلف شامل متن، صدا، تصویر، ویدئو و حتی مخازن کامل کد را فراهم میکند.
توسعهدهندگان و شرکتها هماکنون میتوانند کار با جمنای ۲.۵ پرو را در Google AI Studio آغاز کنند و کاربران Gemini Advanced نیز میتوانند آن را در منوی کشویی مدل در دسکتاپ و موبایل انتخاب کنند. این مدل در هفتههای آتی از طریق Vertex AI نیز در دسترس قرار خواهد گرفت.
گوگل از دریافت بازخورد کاربران برای بهبود مستمر قابلیتهای چشمگیر جمنای با هدف ارائه هوش مصنوعی مفیدتر استقبال میکند.
دیدگاهتان را بنویسید