ICLR 2026 в Рио: что думают исследователи о масштабировании больших моделей
ICLR 2026 в конце апреля собрала ведущих исследователей на Рио-де-Жанейро. На самой престижной конференции года обсуждали главное: как масштабировать модели эфф

ICLR 2026 в конце апреля прошла в Рио-де-Жанейро и подтвердила статус главного ежегодного собрания AI-исследователей. Для научного сообщества это больше, чем престижная публикация в журналах: это место, где рождаются и проверяются идеи, которые через год станут индустриальным стандартом.
Масштабирование с оглядкой на эффективность
Эпоха «больше параметров = лучше модель» медленно, но верно идёт к концу. На ICLR громче всего говорили не о размере новых моделей, а о Return on Investment: вложил 100 миллионов, получил улучшение на 3% — экономически это уже не имеет смысла. Исследователи устали делать вид, что масштабирование гарантирует прогресс. Почему это произошло? Чипы дорожают, а не дешевеют. Удвоение параметров больше не даёт удвоение производительности. Компании начали честно считать, во что обходится обучение базовой модели плюс файнтьюнинг для каждой специфической задачи.
- Длинные контексты (200K+ токенов) становятся стандартом, а не экзотикой Инженеры оптимизируют скорость вывода и энергоэффективность, а не только размер весов Появляются методы динамического масштабирования вычислений в зависимости от входных данных * Мультиэкспертные модели (MoE) вытесняют классические плотные архитектуры На конференции был заметен сдвиг в менталитете: исследователи говорят о long-lived foundation models — моделях, которые живут долго и улучшаются итеративно. Вместо постоянного переобучения с нуля, добавляют новые данные, специализированные адаптеры, новые слои. Это дешевле, проще в production, и это становится новой нормой.
Безопасность как приоритет
Тем про безопасность и гарантии было на конференции видимо больше, чем годом ранее. На ICLR 2025 это была экзотика. В 2026 году — мейнстрим. Исследователи говорят про то, что большие модели нужно учить не только на performance, но и на robustness: устойчивость к adversarial примерам, к распределительным сдвигам, к попыткам манипуляций.
«Мы не можем больше выпускать модель и надеяться, что её никто не сломает в боевых условиях» — типичная позиция на панельных дискуссиях конференции.
Это не просто про регулирование (хотя государства и создают новые требования). Это про то, что научное сообщество само осознало: гонка за SOTA результатами опасна, если не считать реальные издержки от вреда.
Открытые веса в тени корпоративных систем
Наиболее напряжённый вопрос на конференции: будет ли у открытого исходного кода в ИИ шанс, если Anthropic, OpenAI и Meta держат закрытыми самые передовые модели? На ICLR было видно расколотое мнение. Одна часть научного сообщества настаивает: открытые модели — критическая инфраструктура, их нужно развивать несмотря на риски. Другая уже реалистична: за лучшими моделями встанут корпорации, у них ресурсы на обучение и ответственность перед инвесторами. Open science может остаться в поддерживающей роли — развивать методологию, но не держать боевую линию.
Что это значит ICLR 2026 показала: эпоха экспоненциального
масштабирования заканчивается, но AI не замедляется — меняется направление. Впереди эпоха системной оптимизации: как эффективнее использовать ресурсы, как сделать модели надёжнее, как открытой науке остаться релевантной. Для стартапов и инженеров это означает: конкурентное преимущество теперь не в том, чтобы обучить ещё большую модель, а в том, чтобы развернуть существующие модели дешевле, быстрее и безопаснее. *Meta признана экстремистской организацией и запрещена в РФ.