Управління ритмом і голосом. Google представляє модель Lyria 3, призначену для створення музики тривалістю 30 секунд.
Компанія Google анонсувала вихід своєї нової моделі генерації музики під назвою Lyria 3. Ця функція буде інтегрована в застосунок Gemini, що дозволить користувачам створювати компактні музичні композиції.
На даний момент функція перебуває в стадії бета-тестування. В найближчі дні вона буде доступна для всіх користувачів Gemini, які досягли 18-річного віку. Створення пісень можливе англійською, німецькою, іспанською, французькою, гінді, японською, корейською та португальською мовами. У планах на майбутнє – збільшити кількість мов, що підтримуються.
Користувачі безкоштовної версії мають обмеження на тривалість треку в 30 секунд. Натомість підписники Google AI Plus, Pro та Ultra отримують більш щедрі ліміти, хоча компанія поки що не розкрила подробиць.
Lyria 3 була створена в дослідницькій лабораторії DeepMind. Це перший реліз Lyria, доступний для широкої аудиторії. Раніше подібні моделі проходили тестування музикантами в рамках сервісу Music AI Sandbox. Крім того, одну з версій використовували деякі творці контенту на YouTube для перетворення усного мовлення в пісенний формат.
Згідно з інформацією від компанії, нова версія моделі отримала ряд вдосконалень. Вона здатна самостійно генерувати тексти пісень, а також надає користувачам розширені можливості для налаштування стилю, темпу та вокалу. Представники Google повідомили, що Lyria 3 може створювати "більш реалістичні та музично складні композиції".
Користувачі мають можливість ввести свій запит у текстовому форматі або надіслати зображення чи відео, з яких модель створить музику. В результаті програма генерує 30-секундний музичний трек та обкладинку альбому, яку розробляє інша модель компанії Google, відома як Nano Banana. Як пояснили у компанії, основна мета цих треків полягає не в створенні музичних шедеврів, а в наданні людям "цікавого і оригінального способу самовираження".
Всі аудіофайли, генеровані Lyria, будуть містити інтегрований цифровий водяний знак SnythID. Цей водяний знак не буде помітним, на відміну від тих, що використовуються в зображеннях або відео. Проте, користувачі зможуть завантажити аудіо в систему Gemini, щоб перевірити наявність маркера, що вказує на штучне створення контенту.