Google добавила генератор музыки Lyria 3 в приложение Gemini
Google представила интеграцию аудиомодели Lyria 3 от DeepMind в мобильное приложение Gemini. Теперь пользователи могут генерировать 30-секундные музыкальные тре

Google добавила генератор музыки Lyria 3 в приложение Gemini
Google сделала значительный шаг в развитии своего универсального ИИ-помощника Gemini, интегрировав в мобильное приложение передовую аудиомодель Lyria 3 от DeepMind. Эта новая функция позволяет пользователям создавать короткие музыкальные композиции продолжительностью до 30 секунд, используя в качестве основы самые разнообразные подсказки: от текстовых описаний до изображений и даже видеороликов. Инновация, запущенная в бета-режиме по всему миру, открывает новые горизонты для творческого самовыражения и укрепляет позиции Google на рынке генеративных ИИ-сервисов.
Предыстория этого обновления кроется в стремительном развитии технологий искусственного интеллекта, в частности, в области генерации мультимедийного контента. Lyria 3 представляет собой последнее поколение аудиомоделей от DeepMind, подразделения Google, специализирующегося на передовых исследованиях в области ИИ. Цель интеграции Lyria 3 в Gemini — превратить ИИ-помощника из инструмента для работы с текстом в полноценный мультимедийный творческий хаб. Ранее Gemini уже демонстрировал впечатляющие возможности в генерации изображений и обработке текстовой информации, а теперь дополняет их аудиокомпонентом, создавая комплексное решение для пользователей, стремящихся к созданию разнообразного контента.
Глубокое погружение в функционал Lyria 3 показывает, насколько гибким стал процесс создания музыки. Пользователи могут задавать конкретные жанры, от классического рока до эмбиента, указывать желаемое настроение композиции — от радостного и энергичного до меланхоличного и спокойного. Возможность использовать в качестве отправной точки изображения или видео придает процессу еще большую интуитивность и креативность.
Например, можно загрузить фотографию заката и попросить ИИ сгенерировать музыку, соответствующую этому визуальному образу. Gemini обрабатывает эти подсказки и, опираясь на возможности Lyria 3, создает уникальные 30-секундные треки. Бета-версия функции доступна глобально на нескольких языках, включая английский, немецкий, испанский, французский, хинди, японский, корейский и португальский, с перспективой дальнейшего расширения языковой поддержки.
Доступ к функции ограничен пользователями приложения Gemini старше 18 лет, что соответствует политике Google в отношении использования ИИ-технологий.
Последствия такого шага для Google и индустрии в целом весьма значительны. Во-первых, это усиливает конкуренцию между крупными технологическими компаниями в области генеративного ИИ. Интегрируя создание музыки непосредственно в своего основного чат-бота, Google предлагает уникальное преимущество, объединяя работу с текстом, изображениями и звуком в едином, доступном интерфейсе. Это может привлечь новую аудиторию пользователей, которые ищут простые и быстрые способы создания музыкального контента для личных проектов, социальных сетей или просто для развлечения. Во-вторых, это демократизирует процесс создания музыки, делая его доступным даже для тех, у кого нет профессиональных музыкальных навыков или дорогостоящего оборудования. Пользователи могут экспериментировать с различными звуковыми ландшафтами, не выходя из приложения Gemini, что стимулирует творческий поиск и инновации.
В заключение, интеграция генератора музыки Lyria 3 в приложение Gemini представляет собой важный этап в эволюции ИИ-помощников. Превращая Gemini в мультимедийный творческий центр, Google не только расширяет функциональные возможности своего продукта, но и открывает новые возможности для миллионов пользователей по всему миру. Эта инновация подчеркивает стремление Google к созданию более интуитивных и мощных инструментов для творчества, стирая границы между различными формами медиа и делая искусственный интеллект еще более интегрированным в повседневную жизнь.