Habr AI→ оригинал

ICLR 2026 в Рио: что думают исследователи о масштабировании больших моделей

ICLR 2026 в конце апреля собрала ведущих исследователей на Рио-де-Жанейро. На самой престижной конференции года обсуждали главное: как масштабировать модели эфф

ICLR 2026 в Рио: что думают исследователи о масштабировании больших моделей
Источник: Habr AI. Коллаж: Hamidun News.
◐ Слушать статью

ICLR 2026 в конце апреля прошла в Рио-де-Жанейро и подтвердила статус главного ежегодного собрания AI-исследователей. Для научного сообщества это больше, чем престижная публикация в журналах: это место, где рождаются и проверяются идеи, которые через год станут индустриальным стандартом.

Масштабирование с оглядкой на эффективность

Эпоха «больше параметров = лучше модель» медленно, но верно идёт к концу. На ICLR громче всего говорили не о размере новых моделей, а о Return on Investment: вложил 100 миллионов, получил улучшение на 3% — экономически это уже не имеет смысла. Исследователи устали делать вид, что масштабирование гарантирует прогресс. Почему это произошло? Чипы дорожают, а не дешевеют. Удвоение параметров больше не даёт удвоение производительности. Компании начали честно считать, во что обходится обучение базовой модели плюс файнтьюнинг для каждой специфической задачи.

  • Длинные контексты (200K+ токенов) становятся стандартом, а не экзотикой Инженеры оптимизируют скорость вывода и энергоэффективность, а не только размер весов Появляются методы динамического масштабирования вычислений в зависимости от входных данных * Мультиэкспертные модели (MoE) вытесняют классические плотные архитектуры На конференции был заметен сдвиг в менталитете: исследователи говорят о long-lived foundation models — моделях, которые живут долго и улучшаются итеративно. Вместо постоянного переобучения с нуля, добавляют новые данные, специализированные адаптеры, новые слои. Это дешевле, проще в production, и это становится новой нормой.

Безопасность как приоритет

Тем про безопасность и гарантии было на конференции видимо больше, чем годом ранее. На ICLR 2025 это была экзотика. В 2026 году — мейнстрим. Исследователи говорят про то, что большие модели нужно учить не только на performance, но и на robustness: устойчивость к adversarial примерам, к распределительным сдвигам, к попыткам манипуляций.

«Мы не можем больше выпускать модель и надеяться, что её никто не сломает в боевых условиях» — типичная позиция на панельных дискуссиях конференции.

Это не просто про регулирование (хотя государства и создают новые требования). Это про то, что научное сообщество само осознало: гонка за SOTA результатами опасна, если не считать реальные издержки от вреда.

Открытые веса в тени корпоративных систем

Наиболее напряжённый вопрос на конференции: будет ли у открытого исходного кода в ИИ шанс, если Anthropic, OpenAI и Meta держат закрытыми самые передовые модели? На ICLR было видно расколотое мнение. Одна часть научного сообщества настаивает: открытые модели — критическая инфраструктура, их нужно развивать несмотря на риски. Другая уже реалистична: за лучшими моделями встанут корпорации, у них ресурсы на обучение и ответственность перед инвесторами. Open science может остаться в поддерживающей роли — развивать методологию, но не держать боевую линию.

Что это значит ICLR 2026 показала: эпоха экспоненциального

масштабирования заканчивается, но AI не замедляется — меняется направление. Впереди эпоха системной оптимизации: как эффективнее использовать ресурсы, как сделать модели надёжнее, как открытой науке остаться релевантной. Для стартапов и инженеров это означает: конкурентное преимущество теперь не в том, чтобы обучить ещё большую модель, а в том, чтобы развернуть существующие модели дешевле, быстрее и безопаснее. *Meta признана экстремистской организацией и запрещена в РФ.

ЖХ
Hamidun News
AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.
Что вы думаете?
Загружаем комментарии…