Google раскрыла масштабы: 3,2 квадриллиона AI-токенов в месяц, рост в семь раз
На I/O 2026 Google раскрыла: обрабатывает 3,2 квадриллиона AI-токенов в месяц, это в семь раз больше, чем год назад. Компания предлагает Gemini 3.5 Flash для эк

На конференции Google I/O 2026 CEO компании Сундар Пичаи раскрыл масштабы обработки искусственного интеллекта. Google ежемесячно обрабатывает 3,2 квадриллиона токенов — это в семь раз больше, чем год назад. Речь идёт о самом масштабном развёртывании AI-инфраструктуры в истории техники.
Экспоненциальный рост вычислений
Цифра в 3,2 квадриллиона токенов в месяц отражает взрывной рост спроса на AI. Семикратный рост за год показывает, что инфраструктура масштабируется нелинейно. Это не просто добавление новых серверов, а полное переосмысление архитектуры под давлением спроса. Google требует такие объёмы для: Работы Gemini в поисковой выдаче и на YouTube (сотни миллионов пользователей) Встраивания ИИ в Gmail, Docs, Maps, Photos и другие потребительские сервисы Обучения и фин-тьюнинга новых моделей на внутренних данных Обслуживания облачного сегмента (Google Cloud) для клиентов * Экспериментов с новыми форматами интеграции ИИ в повседневные продукты Такой масштаб подразумевает, что даже небольшой прирост эффективности модели даёт огромную экономию на электричество и серверное железо. Каждый процент оптимизации — это десятки миллионов долларов в год.
Gemini 3.5
Flash — оптимизация под нагрузку Именно поэтому Google представила Gemini 3.5 Flash — более лёгкую версию своего флагмана. Модель разработана так, чтобы обрабатывать большинство рутинных задач с меньшим расходом вычислений, но без критических потерь в качестве ответов. Flash берёт нагрузку с основных моделей, позволяя компании эффективнее распределять вычислительные ресурсы. Стоимость обработки одного токена в Flash ниже в несколько раз по сравнению с полными версиями. Это не урезанная модель, а инженерное решение для реальных задач, которые не требуют максимальной мощности.
Гонка за инфраструктурное превосходство
Google явно сигнализирует о том, что инвестировал в масштабирование больше, чем конкуренты. OpenAI не раскрывает такие цифры, но известно, что они тоже наращивают мощности для ChatGPT. Запуск моделей от Anthropic, Meta Llama и других игроков требует серьёзных вычислительных объёмов. Это гонка вооружений, но не за количество параметров в модели, а за саму инфраструктуру. Кто масштабирует быстрее и дешевле — тот выигрывает войну за рынок.
Что это значит
Публичное раскрытие этих цифр — сигнал инвесторам о реальном масштабе ставок Google на AI. Компания не скрывает, что это дорого. Но затраты окупаются: интеграция ИИ в поиск, видео, облако — это мощные точки монетизации. Для разработчиков и стартапов вывод простой: инвестируйте в оптимизацию, а не просто в масштабирование. *Meta признана экстремистской организацией и запрещена в РФ.