TechCrunch→ оригинал

Голос вместо текста: ElevenLabs ставит на смерть клавиатуры

На Web Summit Qatar глава ElevenLabs Мати Станишевски сделал ставку, которая кажется очевидной, но всё ещё пугает: голос станет главным интерфейсом для ИИ. Логи

Голос вместо текста: ElevenLabs ставит на смерть клавиатуры
Источник: TechCrunch. Коллаж: Hamidun News.

Давайте честно: печатать на клавиатуре, особенно на стеклянной в смартфоне — это костыль. Мы придумали этот способ общения с машинами, потому что машины были глупыми и понимали только точные команды. Но на Web Summit Qatar генеральный директор ElevenLabs Мати Станишевски озвучил то, что витает в воздухе Кремниевой долины: этот костыль скоро отправят на свалку истории. Голос — вот настоящий, нативный интерфейс будущего.

Заявление прозвучало не в вакууме. Посмотрите, что происходит вокруг. Мы годами тренировались быть хорошими «промпт-инженерами», подбирая слова для чат-ботов, но индустрия резко меняет вектор. OpenAI выкатывает голосовые режимы, которые умеют хихикать и перебивать вас, Google интегрирует Gemini в Android так, чтобы вы говорили с телефоном, а не тапали по нему. Apple, по слухам, готовит Siri, которая наконец-то перестанет быть поводом для шуток. Станишевски просто подсветил очевидный тренд: барьер между мыслью человека и действием машины должен исчезнуть.

Почему это важно именно сейчас? Раньше голосовые помощники были тупыми. Они слышали слова, но не понимали контекст. Теперь, когда за «ушами» стоит мощная LLM, ситуация изменилась. ElevenLabs, начинавшая как стартап по клонированию голоса (и наделавшая шума в мире дипфейков), теперь позиционирует себя как архитектор этого нового мира. Их технология позволяет ИИ не просто бубнить текст, а передавать эмоции, паузы и интонации. Это убирает эффект «зловещей долины» и делает разговор с машиной пугающе естественным.

Интересно здесь то, как это меняет наше взаимодействие с «железом». Если голос становится основным интерфейсом, зачем нам экраны в 6,7 дюйма? Это открывает дорогу для тех самых носимых гаджетов, которые пока проваливаются в продажах (привет, Humane AI Pin и Rabbit R1). Возможно, проблема была не в форм-факторе, а в том, что софт ещё не был готов к полноценному диалогу. ElevenLabs и их коллеги по цеху пытаются решить проблему задержки ответа — латентности. Чтобы заменить клавиатуру, ИИ должен отвечать мгновенно, как живой собеседник, а не думать три секунды над погодой.

Конечно, остаются вопросы приватности. Говорить с ИИ в метро или опенспейсе — так себе затея. Но дома, в машине или через наушники это становится новой нормой. Мы возвращаемся к тому, с чего начинали человеческую коммуникацию — к устному слову, только теперь нашим собеседником будет кремниевый чип, который никогда не устаёт и знает всё на свете.

Главное: Интерфейсы становятся невидимыми. Если прогноз сбудется, дизайн приложений и сайтов уйдет на второй план, а главным конкурентным преимуществом станет то, насколько «человечным» и умным будет голос вашего сервиса.

ЖХ
Hamidun News
AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.
Загружаем комментарии…