معرفی مدل Lyria برای تولید آهنگ با هوش مصنوعی

در جریان رویداد Cloud Next، گوگل از جدیدترین مدلهای هوش مصنوعی مولد (Generative AI) در پلتفرم Vertex AI پردهبرداری کرد — با یک سورپرایز هیجانانگیز: مدل تولید موسیقی Lyria 🎧
🎼 Lyria: هوش مصنوعی آهنگساز
مدل Lyria، اکنون در نسخه پیشنمایش برای کاربران منتخب فعال شده و میتواند از روی متن، موسیقی بسازد — از سولو پیانوی جَز گرفته تا لُو-فای و الکترونیک. گوگل آن را جایگزینی برای کتابخانههای موسیقی بدون حق امتیاز میداند.
🗣 Chirp 3: شبیهسازی صدا با ۱۰ ثانیه نمونه
Chirp 3، مدل جدید گوگل برای پردازش صوت، اکنون بهصورت عمومی در دسترس است و قابلیت شبیهسازی صدا در ۳۵ زبان را با فقط ۱۰ ثانیه صوت نمونه دارد.
ویژگی جدید «Transcription with Diarization» نیز با کمک همین مدل، میتواند صدای چند نفر را در یک فایل تشخیص داده و جدا کند.
🔐 البته برای جلوگیری از سوءاستفاده، فرایند بررسی مجوز استفاده از صدا الزامی است.
🎥 Veo 2: ویدیو بساز، ویرایش کن، جادو کن!
مدل Veo 2 حالا میتواند:
-
اشیاء، لوگو و بکگراند را از ویدیو حذف کند
-
کادر تصویر را گسترش دهد (مثلاً از افقی به عمودی)
-
زوایای دوربین و سرعت صحنه را کنترل کند
-
کلیپهایی مانند تایملپس، شات هوایی و صحنههای سینمایی تولید کند
🖼 Imagen 3 هم ارتقاء یافت
مدل تولید تصویر Imagen 3 حالا بهتر از همیشه میتواند اشیاء ناخواسته را حذف کرده و بخشهای خراب یا حذفشدهی تصاویر را بازسازی کند.
🔏 واترمارک و مسئولیتپذیری
تمام محتوای تولیدی توسط Lyria، Veo و Imagen دارای واترمارک دیجیتالی SynthID هستند تا قابل ردیابی باشند. گوگل همچنین اعلام کرده که:
-
از دادههای مشخص برای آموزش این مدلها نام نبرده
-
اما امکان «عدم مشارکت» در آموزش مدلها را فراهم کرده
-
و برای کاربران Vertex AI، پوشش حقوقی در قبال دعاوی کپیرایت در نظر گرفته است
دیدگاهتان را بنویسید