TechCrunch→ оригинал

Google lançou discretamente IA de ditado para iOS que funciona sem internet

Google lançou discretamente um novo aplicativo de IA de ditado para iOS que funciona sem conexão à internet. Baseado em modelos de linguagem Gemma proprietários

Google lançou discretamente IA de ditado para iOS que funciona sem internet
Источник: TechCrunch. Коллаж: Hamidun News.

Google тихо выпустила приложение для голосовой диктовки на iOS, работающее полностью без интернета. Новинка использует языковые модели Gemma — собственную серию компактных ИИ-моделей Google, оптимизированных для запуска прямо на устройстве. Это прямой удар по рынку голосового ввода, который до сих пор контролируют сторонние разработчики.

Без лишнего шума и громких анонсов Google разместила новое приложение в App Store. Оно позиционируется как инструмент диктовки нового поколения: пользователь говорит — модель распознаёт, обрабатывает и выводит текст, причём всё это происходит локально на iPhone. Ни один голосовой фрагмент не отправляется на удалённые серверы.

В основе приложения лежат модели Gemma — семейство открытых языковых моделей, которое Google активно развивает с начала 2024 года. В отличие от тяжёлых облачных моделей, Gemma спроектирована под запуск на потребительских устройствах с ограниченными ресурсами: смартфонах, ноутбуках и планшетах. Компания уже встроила Gemma в несколько Android-функций, и теперь перенесла аналогичный подход на iOS — платформу, где Google исторически уступает позиции Apple.

Главный конкурент нового приложения — Wispr Flow, которое быстро стало фаворитом технологического сообщества: стартапы, разработчики и авторы контента используют его для голосового ввода в любом приложении на Mac и Windows. Wispr предлагает удобный оверлей, диктовку в любом поле ввода и интеграцию с рабочими инструментами. Продукт Google пока скромнее по функционалу, но козыри у него другие.

Первый — приватность. Офлайн-обработка означает, что голосовые данные физически не покидают устройство. Для многих пользователей это принципиально: диктовка часто содержит личную информацию, рабочие документы, конфиденциальные переговоры.

Облачные сервисы, даже с хорошей политикой конфиденциальности, остаются точкой уязвимости. Локальная обработка снимает вопрос полностью. Второй — скорость.

Отсутствие сетевых запросов убирает задержку между речью и текстом. На практике это особенно заметно при нестабильном соединении — в метро, самолёте, слабых зонах покрытия. Приложение работает одинаково стабильно вне зависимости от качества интернета.

Третий — экономия трафика. Диктовка в облако создаёт постоянный поток аудиоданных. Для пользователей с ограниченными тарифными планами это реальная проблема.

Офлайн-режим исключает любой расход мобильных данных на ИИ-обработку. Запуск на iOS выглядит как стратегический сигнал. Google активно продвигает Gemma как открытое решение для on-device ИИ и демонстрирует его возможности через собственные продукты.

Диктовочное приложение — наглядный proof of concept: небольшая модель справляется с задачей распознавания речи в реальном времени без облачной поддержки. Рынок голосового ввода быстро становится конкурентным. Apple улучшает встроенную диктовку с каждой версией iOS.

Microsoft интегрирует голосовые функции в Windows через Copilot. Стартапы — Wispr Flow, Superwhisper и другие — строят продукты поверх открытых моделей вроде Whisper от OpenAI. Теперь к этой гонке подключается Google с собственным стеком и сильным брендом.

Тихий релиз без пресс-релиза — типичная для Google тактика с новыми экспериментальными продуктами. Компания выпускает, наблюдает за реакцией аудитории, итерирует. Если приложение наберёт органический traction, следует ожидать более широкого анонса, интеграции с Google Docs и, возможно, версии для Android.

Для пользователей это в любом случае хорошая новость: конкуренция давит цены вниз и толкает качество вверх.

ЖХ
Hamidun News
AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.
Загружаем комментарии…