TechCrunch→ оригинал

Google quietly launched AI dictation for iOS that works without internet

Google quietly launched a new AI dictation app for iOS that works without internet connection. It's built on proprietary Gemma language models running directly

Google quietly launched AI dictation for iOS that works without internet
Источник: TechCrunch. Коллаж: Hamidun News.

Google тихо выпустила приложение для голосовой диктовки на iOS, работающее полностью без интернета. Новинка использует языковые модели Gemma — собственную серию компактных ИИ-моделей Google, оптимизированных для запуска прямо на устройстве. Это прямой удар по рынку голосового ввода, который до сих пор контролируют сторонние разработчики.

Без лишнего шума и громких анонсов Google разместила новое приложение в App Store. Оно позиционируется как инструмент диктовки нового поколения: пользователь говорит — модель распознаёт, обрабатывает и выводит текст, причём всё это происходит локально на iPhone. Ни один голосовой фрагмент не отправляется на удалённые серверы.

В основе приложения лежат модели Gemma — семейство открытых языковых моделей, которое Google активно развивает с начала 2024 года. В отличие от тяжёлых облачных моделей, Gemma спроектирована под запуск на потребительских устройствах с ограниченными ресурсами: смартфонах, ноутбуках и планшетах. Компания уже встроила Gemma в несколько Android-функций, и теперь перенесла аналогичный подход на iOS — платформу, где Google исторически уступает позиции Apple.

Главный конкурент нового приложения — Wispr Flow, которое быстро стало фаворитом технологического сообщества: стартапы, разработчики и авторы контента используют его для голосового ввода в любом приложении на Mac и Windows. Wispr предлагает удобный оверлей, диктовку в любом поле ввода и интеграцию с рабочими инструментами. Продукт Google пока скромнее по функционалу, но козыри у него другие.

Первый — приватность. Офлайн-обработка означает, что голосовые данные физически не покидают устройство. Для многих пользователей это принципиально: диктовка часто содержит личную информацию, рабочие документы, конфиденциальные переговоры.

Облачные сервисы, даже с хорошей политикой конфиденциальности, остаются точкой уязвимости. Локальная обработка снимает вопрос полностью. Второй — скорость.

Отсутствие сетевых запросов убирает задержку между речью и текстом. На практике это особенно заметно при нестабильном соединении — в метро, самолёте, слабых зонах покрытия. Приложение работает одинаково стабильно вне зависимости от качества интернета.

Третий — экономия трафика. Диктовка в облако создаёт постоянный поток аудиоданных. Для пользователей с ограниченными тарифными планами это реальная проблема.

Офлайн-режим исключает любой расход мобильных данных на ИИ-обработку. Запуск на iOS выглядит как стратегический сигнал. Google активно продвигает Gemma как открытое решение для on-device ИИ и демонстрирует его возможности через собственные продукты.

Диктовочное приложение — наглядный proof of concept: небольшая модель справляется с задачей распознавания речи в реальном времени без облачной поддержки. Рынок голосового ввода быстро становится конкурентным. Apple улучшает встроенную диктовку с каждой версией iOS.

Microsoft интегрирует голосовые функции в Windows через Copilot. Стартапы — Wispr Flow, Superwhisper и другие — строят продукты поверх открытых моделей вроде Whisper от OpenAI. Теперь к этой гонке подключается Google с собственным стеком и сильным брендом.

Тихий релиз без пресс-релиза — типичная для Google тактика с новыми экспериментальными продуктами. Компания выпускает, наблюдает за реакцией аудитории, итерирует. Если приложение наберёт органический traction, следует ожидать более широкого анонса, интеграции с Google Docs и, возможно, версии для Android.

Для пользователей это в любом случае хорошая новость: конкуренция давит цены вниз и толкает качество вверх.

ЖХ
Hamidun News
AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.
Загружаем комментарии…