جمنای قوی‌ترین مدل جهان

گوگل از جدیدترین دستاورد خود در عرصه هوش مصنوعی، مدل جمنای ۲.۵، رونمایی کرد. این مدل که پیشرفته‌ترین نمونه در نوع خود به شمار می‌رود، توانسته در ارزیابی‌های تخصصی LMArena با اختلاف چشمگیری رتبه نخست را به خود اختصاص دهد.

بر اساس گزارش‌های منتشر شده از سوی گوگل، مدل‌های جمنای ۲.۵ با بهره‌گیری از قابلیت “تفکر قبل از پاسخ”، عملکردی به مراتب دقیق‌تر و کارآمدتر در پردازش اطلاعات و استدلال‌های پیچیده از خود نشان می‌دهند. این ویژگی، که فراتر از صرفاً طبقه‌بندی و پیش‌بینی داده‌ها است، به هوش مصنوعی امکان می‌دهد تا با تحلیل عمیق‌تر، استنتاج منطقی، در نظر گرفتن متن و جزئیات، تصمیمات آگاهانه‌تری اتخاذ کند.

گوگل با اشاره به تلاش‌های پیشین خود در ارتقای هوش مصنوعی از طریق یادگیری تقویتی و روش‌های زنجیره تفکر، اعلام کرد که جمنای ۲.۵ گامی نوین در این مسیر به شمار می‌رود. این مدل با ترکیب یک مدل پایه بهینه‌سازی شده و فرآیندهای پس‌آموزشی پیشرفته، به سطح جدیدی از عملکرد دست یافته است. این شرکت قصد دارد قابلیت‌های تفکری مشابه را به طور مستقیم در تمامی مدل‌های آینده خود ادغام کند تا امکان حل مسائل پیچیده‌تر و پشتیبانی از عامل‌های هوشمند آگاه به متن فراهم شود.

نسخه آزمایشی جمنای ۲.۵ پرو، به عنوان پیشرفته‌ترین مدل گوگل برای انجام وظایف پیچیده، هم‌اکنون در پلتفرم Google AI Studio و برای کاربران Gemini Advanced در دسترس قرار گرفته است و به زودی از طریق Vertex AI نیز ارائه خواهد شد. این مدل در صدر جدول LMArena قرار دارد که نشان‌دهنده عملکرد قوی و سبک پاسخ‌دهی باکیفیت آن از دیدگاه کاربران است. علاوه بر این، جمنای ۲.۵ پرو در زمینه‌های استدلال و برنامه‌نویسی نیز عملکرد چشمگیری داشته و در آزمون‌های رایج برنامه‌نویسی، ریاضی و علوم پیشتاز است.

در به‌روزرسانی‌های تکمیلی، گوگل با ارائه نتایج ارزیابی‌های MRCR (وضوح ارجاع چندگانه)، بر توانایی استدلال پیشرفته جمنای ۲.۵ پرو تأکید کرده است. این مدل بدون استفاده از تکنیک‌های پرهزینه زمان آزمایش، در آزمون‌های ریاضی و علوم نظیر GPQA و AIME 2025 نیز عملکرد برتری از خود نشان داده است. همچنین، در آزمون Humanity’s Last Exam که توسط متخصصان برای سنجش مرزهای دانش و استدلال انسانی طراحی شده، امتیاز قابل توجه ۱۸.۸ درصد را کسب کرده است.

در زمینه برنامه‌نویسی، جمنای ۲.۵ پیشرفت چشمگیری نسبت به نسخه ۲.۰ داشته و در ایجاد برنامه‌های کاربردی وب بصری و برنامه‌های کدنویسی عامل‌محور، همچنین در تبدیل و ویرایش کد، عملکرد ممتازی را به نمایش گذاشته است. در آزمون SWE-Bench Verified، که استاندارد صنعت برای ارزیابی عامل‌های کدنویسی است، جمنای ۲.۵ پرو با تنظیمات عامل سفارشی، امتیاز ۶۳.۸ درصد را کسب کرده است.

یکی از قابلیت‌های برجسته جمنای ۲.۵ پرو، توانایی آن در ایجاد بازی‌های ویدئویی از طریق تولید کد اجرایی تنها با یک دستور متنی است.

مدل جمنای ۲.۵ با بهره‌گیری از ویژگی‌های ممتاز نسل‌های قبلی، از جمله قابلیت چندوجهی بودن ذاتی و پنجره متنی طولانی (در حال حاضر ۱ میلیون توکن و به زودی ۲ میلیون)، امکان درک مجموعه‌های داده وسیع و حل مسائل پیچیده از منابع اطلاعاتی مختلف شامل متن، صدا، تصویر، ویدئو و حتی مخازن کامل کد را فراهم می‌کند.

توسعه‌دهندگان و شرکت‌ها هم‌اکنون می‌توانند کار با جمنای ۲.۵ پرو را در Google AI Studio آغاز کنند و کاربران Gemini Advanced نیز می‌توانند آن را در منوی کشویی مدل در دسکتاپ و موبایل انتخاب کنند. این مدل در هفته‌های آتی از طریق Vertex AI نیز در دسترس قرار خواهد گرفت.

گوگل از دریافت بازخورد کاربران برای بهبود مستمر قابلیت‌های چشمگیر جمنای با هدف ارائه هوش مصنوعی مفیدتر استقبال می‌کند.