Google раскрыла масштабы: 3,2 квадриллиона AI-токенов в месяц, рост в семь раз

На I/O 2026 Google раскрыла: обрабатывает 3,2 квадриллиона AI-токенов в месяц, это в семь раз больше, чем год назад. Компания предлагает Gemini 3.5 Flash для…

ЖХ

Редакция Hamidun News

AI‑мониторинг · 3DNews AI

21 мая 2026 г.· 3 мин

AI-обработка оригинала 3DNews AI; редакция Hamidun News

Google раскрыла масштабы: 3,2 квадриллиона AI-токенов в месяц, рост в семь раз — Источник: 3DNews AI. Коллаж: Hamidun News.

◐ Слушать статью

На конференции Google I/O 2026 CEO компании Сундар Пичаи раскрыл масштабы обработки искусственного интеллекта. Google ежемесячно обрабатывает 3,2 квадриллиона токенов — это в семь раз больше, чем год назад. Речь идёт о самом масштабном развёртывании AI-инфраструктуры в истории техники.

Экспоненциальный рост вычислений

Цифра в 3,2 квадриллиона токенов в месяц отражает взрывной рост спроса на AI. Семикратный рост за год показывает, что инфраструктура масштабируется нелинейно. Это не просто добавление новых серверов, а полное переосмысление архитектуры под давлением спроса. Google требует такие объёмы для: Работы Gemini в поисковой выдаче и на YouTube (сотни миллионов пользователей) Встраивания ИИ в Gmail, Docs, Maps, Photos и другие потребительские сервисы Обучения и фин-тьюнинга новых моделей на внутренних данных Обслуживания облачного сегмента (Google Cloud) для клиентов * Экспериментов с новыми форматами интеграции ИИ в повседневные продукты Такой масштаб подразумевает, что даже небольшой прирост эффективности модели даёт огромную экономию на электричество и серверное железо. Каждый процент оптимизации — это десятки миллионов долларов в год.

Gemini 3.5

Flash — оптимизация под нагрузку Именно поэтому Google представила Gemini 3.5 Flash — более лёгкую версию своего флагмана. Модель разработана так, чтобы обрабатывать большинство рутинных задач с меньшим расходом вычислений, но без критических потерь в качестве ответов. Flash берёт нагрузку с основных моделей, позволяя компании эффективнее распределять вычислительные ресурсы. Стоимость обработки одного токена в Flash ниже в несколько раз по сравнению с полными версиями. Это не урезанная модель, а инженерное решение для реальных задач, которые не требуют максимальной мощности.

Гонка за инфраструктурное превосходство

Google явно сигнализирует о том, что инвестировал в масштабирование больше, чем конкуренты. OpenAI не раскрывает такие цифры, но известно, что они тоже наращивают мощности для ChatGPT. Запуск моделей от Anthropic, Meta Llama и других игроков требует серьёзных вычислительных объёмов. Это гонка вооружений, но не за количество параметров в модели, а за саму инфраструктуру. Кто масштабирует быстрее и дешевле — тот выигрывает войну за рынок.

Что это значит

Публичное раскрытие этих цифр — сигнал инвесторам о реальном масштабе ставок Google на AI. Компания не скрывает, что это дорого. Но затраты окупаются: интеграция ИИ в поиск, видео, облако — это мощные точки монетизации. Для разработчиков и стартапов вывод простой: инвестируйте в оптимизацию, а не просто в масштабирование. *Meta признана экстремистской организацией и запрещена в РФ.

ЖХ

Hamidun News

AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.

Telegram-канал RSS hamidun.com

Хотите не читать про ИИ, а внедрить его?

«AI News» — это полезные новости из мира ИИ. Системно научиться работать с нейросетями и применять их в работе — в Hamidun Academy.

🎓 Academy — 7 дней бесплатно Бесплатная консультация

Главное из мира ИИ — раз в неделю

7 ключевых событий недели, отобранных вручную. Без шума, репостов и пресс-релизов.

Готово! Проверьте почту — мы отправили подтверждение.