Google выпускает новые AI-чипы для инференса и бросает вызов Nvidia
Google разрабатывает новое поколение AI-чипов с фокусом на инференс — прямой вызов Nvidia. Cerebras объявила о планах IPO спустя месяцы после отзыва предыдущей

Google бросает вызов Nvidia: компания разрабатывает новое поколение собственных AI-чипов, ориентированных на инференс — финальную стадию работы нейросетей, когда обученная модель обрабатывает запросы пользователей в режиме реального времени. Чипы для инференса принципиально отличаются от тех, что нужны для обучения моделей. Тренировка крупных языковых систем — это месяцы вычислений на тысячах GPU, разовая капитальная затрата.
Инференс — постоянная нагрузка: каждый раз, когда пользователь отправляет запрос в Gemini, ChatGPT или любой другой AI-сервис, чип выполняет инференс. По мере того как AI-приложения набирают сотни миллионов пользователей, именно инференс-затраты становятся главной статьёй расходов технологических компаний. По ряду оценок, к 2027 году они превысят затраты на обучение в три-четыре раза.
Google давно строит собственную кремниевую стратегию. Компания разрабатывает TPU (Tensor Processing Units) с 2015 года — задолго до того, как AI-чипы стали темой первых полос. До сих пор эти процессоры использовались преимущественно внутри Google Cloud и для тренировки моделей Gemini.
Теперь компания намерена создать специализированное железо именно для инференса — с более высокой пропускной способностью и меньшим энергопотреблением в расчёте на один запрос. Для Nvidia, чьи чипы H100 и H200 стали стандартом дата-центров по всему миру, это прямой вызов. Google — один из крупнейших покупателей Nvidia в мире, и переход хотя бы части нагрузки на собственное железо означает существенные потери для компании из Санта-Клары.
Параллельно в секторе AI-чипов назревает ещё одно событие: Cerebras Systems объявила о планах выйти на биржу. Компания известна флагманским продуктом — Wafer-Scale Engine, по сути целой кремниевой пластиной, функционирующей как единый процессор. Такая архитектура устраняет задержки при передаче данных между отдельными чипами и ускоряет обработку больших моделей.
Cerebras уже пыталась провести IPO ранее, но отозвала заявку. Возвращение на биржевой путь — сигнал рынку: несмотря на охлаждение части AI-инвесторов, альтернативные архитектуры чипов по-прежнему воспринимаются как перспективный актив. Компания позиционирует свои решения как особенно эффективные для работы с открытыми моделями в закрытых корпоративных контурах — сегмент, быстро растущий на фоне требований к безопасности и суверенитету данных.
Третья история недели — из космоса. Blue Origin успешно запустила ракету New Glenn и посадила её многоразовый ускоритель — важный технический рубеж на пути к снижению стоимости запусков. Однако полезная нагрузка, спутник AST SpaceMobile, не вышла на расчётную орбиту.
AST SpaceMobile строит глобальную сеть широкополосного интернета, работающую напрямую со смартфонов без специальных терминалов. Орбитальная неудача немедленно отозвалась на котировках: акции компании упали. Рынок в очередной раз напомнил, что в космосе технический успех и коммерческий результат — разные вещи.
Три новости вместе рисуют портрет технологической экономики середины 2020-х. Гонка AI-чипов выходит за рамки дуополии: помимо Nvidia и AMD, в борьбу за инфраструктуру вступают технологические гиганты с собственным кремнием и специализированные стартапы вроде Cerebras. Вопрос о том, кто будет контролировать физическую инфраструктуру AI-эпохи, остаётся открытым.