Google представила Gemini 3.5 Flash: быстрая и дешёвая модель для кодирования и AI-агентов
Google запустила Gemini 3.5 Flash на конференции I/O 2026. Новая модель работает в четыре раза быстрее флагманской версии Gemini 3, при этом стоя половину цены.

На конференции Google I/O 2026 представлена Gemini 3.5 Flash — новая модель, которая работает в четыре раза быстрее флагманской версии Gemini 3, стоит половину цены и превосходит её на бенчмарках для кодирования и управления AI-агентами.
Оптимизация вместо масштаба Gemini 3.5 Flash создана с другой философией.
Вместо добавления параметров инженеры Google убрали лишние слои, которые отвечали за универсальность — за сочинение стихов, философские дебаты, творческое письмо. Вместо этого они жестко оптимизировали архитектуру под задачи, требующие максимальной скорости: генерация кода в реальном времени, обработка документов, управление автоматизированными AI-агентами. На стандартных бенчмарках кодирования результаты удивляют: Flash обходит даже Pro-версию старшей Gemini 3. Это работает, потому что модель не тратит вычислительные ресурсы на способности, которые разработчикам не нужны. Компромисс в универсальности дал огромный выигрыш в специализации. Скорость вывода особенно критична. Вместо полусекундной задержки при предложении кода в IDE результаты появляются почти мгновенно. Это меняет опыт использования и повышает производительность разработчика на практике.
Целевые аудитории
Flash разработана для конкретных категорий пользователей: Разработчики — автодополнение кода и предложения без заметных задержек в IDE AI-инженеры — быстрое управление агентами, выполняющими задачи в браузере и через APIs Data-профессионалы — обработка логов, документов, потоков текста с низкой латенцией Стартапы и малый бизнес — сокращение расходов на API при сохранении скорости * Enterprise — масштабирование запросов при одновременном снижении стоимости Каждый из этих сегментов выигрывает не только в цене, но и в производительности на специализированных задачах.
Тренд в индустрии
Несколько лет подряд AI-индустрия двигалась по одной траектории: больше параметров, больше данных обучения, больше видеокарт. Это привело к росту цен и образу AI как дорогостоящей технологии только для крупных компаний. Gemini 3.5 Flash разрушает этот нарратив. Она показывает, что правильная архитектура и фокусировка часто эффективнее, чем добавление мощи. Это открывает путь к волне специализированных моделей, каждая из которых отточена под конкретный класс задач. Параллельно видны признаки фрагментации: вместо попытки создать одну модель для всего, индустрия движется к наборам инструментов. Одна модель для кода, другая для анализа, третья для работы с языком. Каждая оптимизирована для своего назначения.
Что это значит Разработчики получают выбор вместо вынужденной переплаты за ненужную универсальность.
Стартапы смогут строить сложные AI-системы с приемлемым бюджетом на API. Enterprise перейдёт от парадигмы «один инструмент на всё» к парадигме «правильный инструмент для каждой задачи». Возможно, мы наблюдаем конец эры мега-моделей и начало эры специализированных инструментов.