TechCrunch→ оригинал

Groq собирает $650 млн и переходит от чипов на инференс-платформу

Groq привлекает $650 млн в новом раунде финансирования и объявляет о смене основной стратегии развития. Вместо фокуса исключительно на разработку AI-чипов компа

Groq собирает $650 млн и переходит от чипов на инференс-платформу
Источник: TechCrunch. Коллаж: Hamidun News.
◐ Слушать статью

Стартап Groq привлекает $650 млн в новом раунде финансирования и объявляет о смене своей основной стратегии развития. Компания переходит от разработки специализированных AI-чипов к созданию комплексной платформы для оптимизации критического AI-инференса — процесса, когда обученная модель обрабатывает реальные пользовательские запросы с максимальной скоростью и минимальной задержкой.

Раунд финансирования на переходе

По информации Axios, Groq проводит внутренний раунд финансирования в размере $650 млн. Эти деньги помогут компании радикально реструктурировать свой бизнес-модель и перенести основной вес разработок с аппаратной части на программное обеспечение и облачные сервисы для оптимизации инференса. Это значительный раунд финансирования, отражающий серьёзные стратегические амбиции компании на рынке, где конкуренция между инновационными стартапами и чиповыми гигантами вроде Nvidia стремительно нарастает. Финансирование приходит в момент роста спроса. Компании, развёртывающие большие языковые модели и другие AI-системы, остро нуждаются в доступном, быстром и надёжном инференсе. Облачные провайдеры вроде AWS и Google Cloud ищут способы снизить стоимость обслуживания AI-инфраструктуры. Groq видит в этом огромный и растущий рынок, который будет только расширяться.

Почему инференс важнее, чем создание чипов

Инференс — это критически важный, финальный шаг в жизни любой AI модели. После того как модель обучена в дата-центре разработчика, её надо развернуть так, чтобы она быстро обрабатывала запросы пользователей. Это задача значительно сложнее, чем просто создание высокопроизводительного чипа общего назначения.

Нужно оптимизировать скорость отклика в миллисекундах, снизить энергопотребление на огромных масштабах (когда система обрабатывает миллионы запросов в день), обеспечить надёжность и масштабируемость, справиться с различными размерами и архитектурами моделей. Groq считает, что её инженерная мощь и глубокое понимание архитектуры нейросетей лучше применить именно здесь, чем вступать в прямую конкуренцию с Nvidia в гонке на сверхбыстрые ускорители для тренировки моделей. Компания планирует предложить: Высокую скорость инференса на специализированных чипах собственного дизайна Программный стек для управления нагрузкой на распределённые дата-центры Оптимизацию и масштабирование для различных размеров и архитектур моделей Интеграцию с ведущими облачными платформами (AWS, Google Cloud, Azure) * Open API для простой интеграции в production-системы клиентов ## Контекст: отказ Nvidia и путь к независимости Это объявление приходит вслед за новостями (упомянутыми уже в заголовке), что компания Nvidia отказалась покупать Groq в акквизиции.

Конкурентная давка на молодой стартап была экстремальной: Nvidia, обладая де-факто монополией на доминирующие GPU-чипы типа H100 и только что выпущенные H200, посчитала, что поглощение инженерной команды Groq не добавило бы достаточной стратегической ценности к её портфелю. Для инвесторов это был чёткий сигнал о том, что даже топовые технологические игроки видят Groq как конкурента, а не как приобретаемый актив. Собирая теперь $650 млн, Groq демонстрирует, что может развиваться независимо и построить собственный, конкурентный бизнес в нише, которая становится стратегически всё более важной для всей индустрии.

Что это значит для индустрии

Для инновационных компаний в AI инфраструктуре это ясный сигнал: специализация на инференсе становится самостоятельным, высокоприбыльным направлением со своей логикой и экономикой. Groq не пытается побеждать Nvidia в гонке на самые быстрые ускорители для тренировки, а сосредоточена на том, где она может добавить наибольшую ценность — в масштабировании готовых моделей. Для компаний-потребителей вроде OpenAI, Anthropic, Mistral AI и других API-провайдеров это значит расширение выбора инженерной инфраструктуры. Они смогут выбирать между несколькими поставщиками инференса вместо того, чтобы целиком полагаться на монопольное предложение Nvidia.

ЖХ
Hamidun News
AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.

Хотите не читать про ИИ, а внедрить его?

«AI News» — это полезные новости из мира ИИ. Системно научиться работать с нейросетями и применять их в работе — в Hamidun Academy.

Что вы думаете?
Загружаем комментарии…