محققان گوگل، ابزاری ایجاد کردهاند که میتواند با هوش مصنوعی، قطعات موسیقی را از ورودیهای متن تولید کند. همانند ChatGPT که میتواند یک فرمان متنی را به مکالمه تبدیل کند و DALL-E که تصاویر را از پیامهای نوشته شده تولید میکند؛ این برنامه هوش مصنوعی نیز میتواند ورودی متن را به موسیقی و ملودیهای نوشته شده را به سازهای دیگر تبدیل کند.
ابزار جدید هوش مصنوعی گوگل، میتواند از متن وارد شده توسط کاربر، ملودیهای حداکثر 5 دقیقهای ایجاد کند. به طوری که هرچقدر دستورالعملها واضحتر باشند، موسیقی بهتر به عنوان خروجی ساخته میشود. علاوه بر این، در هنگام ورود دستورالعمل امکان انتخاب ژانر، حالوهوا و حتی سازهای خاص نیز وجود دارد.
طبق مطالب منتشر شده در گیتهاب، این مدل هوش مصنوعی MusicLM نام دارد و این شرکت مجموعهای از نمونههای تولید شده را با استفاده از این مدل را بارگذاری کرده است. این نمونهها MusicCaps نامیده میشوند و اساساً مجموعهای از دادههای متشکل از 5/5 هزار جفت موسیقی-متن، همراه با توضیحات متن کامل که توسط متخصصان ارائهشده، هستند.
MusicLM نسبت به سیستمهای قبلی مشابه هم در کیفیت صدا و هم از نظر رعایت توضیحات متن بهتر عمل میکند. علاوه بر این، MusicLM میتواند هم به متن و هم به ملودی مشروط شود، به این معنی که میتواند ملودیهای زمزمهشده را مطابق با موارد توصیفشده در یک عنوان متن تغییر دهد.