3DNews AI→ original

Google раскрыла масштабы: 3,2 квадриллиона AI-токенов в месяц, рост в семь раз

На I/O 2026 Google раскрыла: обрабатывает 3,2 квадриллиона AI-токенов в месяц, это в семь раз больше, чем год назад. Компания предлагает Gemini 3.5 Flash для эк

AI-processed from 3DNews AI; edited by Hamidun News
Google раскрыла масштабы: 3,2 квадриллиона AI-токенов в месяц, рост в семь раз
Source: 3DNews AI. Collage: Hamidun News.

На конференции Google I/O 2026 CEO компании Сундар Пичаи раскрыл масштабы обработки искусственного интеллекта. Google ежемесячно обрабатывает 3,2 квадриллиона токенов — это в семь раз больше, чем год назад. Речь идёт о самом масштабном развёртывании AI-инфраструктуры в истории техники.

Экспоненциальный рост вычислений

Цифра в 3,2 квадриллиона токенов в месяц отражает взрывной рост спроса на AI. Семикратный рост за год показывает, что инфраструктура масштабируется нелинейно. Это не просто добавление новых серверов, а полное переосмысление архитектуры под давлением спроса. Google требует такие объёмы для: Работы Gemini в поисковой выдаче и на YouTube (сотни миллионов пользователей) Встраивания ИИ в Gmail, Docs, Maps, Photos и другие потребительские сервисы Обучения и фин-тьюнинга новых моделей на внутренних данных Обслуживания облачного сегмента (Google Cloud) для клиентов * Экспериментов с новыми форматами интеграции ИИ в повседневные продукты Такой масштаб подразумевает, что даже небольшой прирост эффективности модели даёт огромную экономию на электричество и серверное железо. Каждый процент оптимизации — это десятки миллионов долларов в год.

Gemini 3.5

Flash — оптимизация под нагрузку Именно поэтому Google представила Gemini 3.5 Flash — более лёгкую версию своего флагмана. Модель разработана так, чтобы обрабатывать большинство рутинных задач с меньшим расходом вычислений, но без критических потерь в качестве ответов. Flash берёт нагрузку с основных моделей, позволяя компании эффективнее распределять вычислительные ресурсы. Стоимость обработки одного токена в Flash ниже в несколько раз по сравнению с полными версиями. Это не урезанная модель, а инженерное решение для реальных задач, которые не требуют максимальной мощности.

Гонка за инфраструктурное превосходство

Google явно сигнализирует о том, что инвестировал в масштабирование больше, чем конкуренты. OpenAI не раскрывает такие цифры, но известно, что они тоже наращивают мощности для ChatGPT. Запуск моделей от Anthropic, Meta Llama и других игроков требует серьёзных вычислительных объёмов. Это гонка вооружений, но не за количество параметров в модели, а за саму инфраструктуру. Кто масштабирует быстрее и дешевле — тот выигрывает войну за рынок.

Что это значит

Публичное раскрытие этих цифр — сигнал инвесторам о реальном масштабе ставок Google на AI. Компания не скрывает, что это дорого. Но затраты окупаются: интеграция ИИ в поиск, видео, облако — это мощные точки монетизации. Для разработчиков и стартапов вывод простой: инвестируйте в оптимизацию, а не просто в масштабирование. *Meta признана экстремистской организацией и запрещена в РФ.

ZK
Hamidun News
AI news without noise. Daily editorial selection from 400+ sources. A product by Zhemal Khamidun, Head of AI at Alpina Digital.

Want to stop reading about AI and start using it?

AI News is a curated feed of AI/tech news. Hamidun Academy teaches you to use AI systematically in your work.

What do you think?
Loading comments…