Groq собирает $650 млн и переходит от чипов на инференс-платформу
Groq привлекает $650 млн в новом раунде финансирования и объявляет о смене основной стратегии развития. Вместо фокуса исключительно на разработку AI-чипов компа

Стартап Groq привлекает $650 млн в новом раунде финансирования и объявляет о смене своей основной стратегии развития. Компания переходит от разработки специализированных AI-чипов к созданию комплексной платформы для оптимизации критического AI-инференса — процесса, когда обученная модель обрабатывает реальные пользовательские запросы с максимальной скоростью и минимальной задержкой.
Раунд финансирования на переходе
По информации Axios, Groq проводит внутренний раунд финансирования в размере $650 млн. Эти деньги помогут компании радикально реструктурировать свой бизнес-модель и перенести основной вес разработок с аппаратной части на программное обеспечение и облачные сервисы для оптимизации инференса. Это значительный раунд финансирования, отражающий серьёзные стратегические амбиции компании на рынке, где конкуренция между инновационными стартапами и чиповыми гигантами вроде Nvidia стремительно нарастает. Финансирование приходит в момент роста спроса. Компании, развёртывающие большие языковые модели и другие AI-системы, остро нуждаются в доступном, быстром и надёжном инференсе. Облачные провайдеры вроде AWS и Google Cloud ищут способы снизить стоимость обслуживания AI-инфраструктуры. Groq видит в этом огромный и растущий рынок, который будет только расширяться.
Почему инференс важнее, чем создание чипов
Инференс — это критически важный, финальный шаг в жизни любой AI модели. После того как модель обучена в дата-центре разработчика, её надо развернуть так, чтобы она быстро обрабатывала запросы пользователей. Это задача значительно сложнее, чем просто создание высокопроизводительного чипа общего назначения.
Нужно оптимизировать скорость отклика в миллисекундах, снизить энергопотребление на огромных масштабах (когда система обрабатывает миллионы запросов в день), обеспечить надёжность и масштабируемость, справиться с различными размерами и архитектурами моделей. Groq считает, что её инженерная мощь и глубокое понимание архитектуры нейросетей лучше применить именно здесь, чем вступать в прямую конкуренцию с Nvidia в гонке на сверхбыстрые ускорители для тренировки моделей. Компания планирует предложить: Высокую скорость инференса на специализированных чипах собственного дизайна Программный стек для управления нагрузкой на распределённые дата-центры Оптимизацию и масштабирование для различных размеров и архитектур моделей Интеграцию с ведущими облачными платформами (AWS, Google Cloud, Azure) * Open API для простой интеграции в production-системы клиентов ## Контекст: отказ Nvidia и путь к независимости Это объявление приходит вслед за новостями (упомянутыми уже в заголовке), что компания Nvidia отказалась покупать Groq в акквизиции.
Конкурентная давка на молодой стартап была экстремальной: Nvidia, обладая де-факто монополией на доминирующие GPU-чипы типа H100 и только что выпущенные H200, посчитала, что поглощение инженерной команды Groq не добавило бы достаточной стратегической ценности к её портфелю. Для инвесторов это был чёткий сигнал о том, что даже топовые технологические игроки видят Groq как конкурента, а не как приобретаемый актив. Собирая теперь $650 млн, Groq демонстрирует, что может развиваться независимо и построить собственный, конкурентный бизнес в нише, которая становится стратегически всё более важной для всей индустрии.
Что это значит для индустрии
Для инновационных компаний в AI инфраструктуре это ясный сигнал: специализация на инференсе становится самостоятельным, высокоприбыльным направлением со своей логикой и экономикой. Groq не пытается побеждать Nvidia в гонке на самые быстрые ускорители для тренировки, а сосредоточена на том, где она может добавить наибольшую ценность — в масштабировании готовых моделей. Для компаний-потребителей вроде OpenAI, Anthropic, Mistral AI и других API-провайдеров это значит расширение выбора инженерной инфраструктуры. Они смогут выбирать между несколькими поставщиками инференса вместо того, чтобы целиком полагаться на монопольное предложение Nvidia.
Хотите не читать про ИИ, а внедрить его?
«AI News» — это полезные новости из мира ИИ. Системно научиться работать с нейросетями и применять их в работе — в Hamidun Academy.