ICLR 2026 в Рио: что думают исследователи о масштабировании больших моделей
ICLR 2026 в конце апреля собрала ведущих исследователей на Рио-де-Жанейро. На самой престижной конференции года обсуждали главное: как масштабировать модели эфф

ICLR 2026 aconteceu no Rio de Janeiro no final de abril e confirmou seu status como o principal encontro anual de pesquisadores de IA. Para a comunidade científica, é mais do que uma publicação prestigiosa em revistas: é um lugar onde nascem e são testadas ideias que se tornarão padrões industriais em um ano.
Dimensionamento com Foco em Eficiência
A era de 'mais parâmetros = modelo melhor' está chegando lentamente, mas seguramente ao seu fim. Na ICLR, o tema mais discutido não era o tamanho dos novos modelos, mas o Retorno sobre o Investimento: investir 100 milhões, obter uma melhoria de 3% — economicamente, isso não faz mais sentido. Os pesquisadores estão cansados de fingir que o dimensionamento garante progresso. Por que isso aconteceu? Os chips estão ficando mais caros, não mais baratos. Dobrar os parâmetros não gera mais o dobro do desempenho. As empresas começaram a calcular honestamente o custo do treinamento de um modelo base mais ajuste fino para cada tarefa específica.
- Contextos longos (200K+ tokens) estão se tornando um padrão, não uma exoticidade
- Engenheiros estão otimizando a velocidade de inferência e eficiência energética, não apenas o tamanho dos pesos
- Métodos de dimensionamento dinâmico de computação com base em dados de entrada estão surgindo
- Modelos de Mistura de Especialistas (MoE) estão deslocando arquiteturas densas clássicas
Uma mudança de mentalidade foi evidente na conferência: os pesquisadores falam sobre modelos de fundação de longa vida — modelos que persistem e melhoram iterativamente. Em vez de retreinar constantemente do zero, eles adicionam novos dados, adaptadores especializados, novas camadas. Isto é mais barato, mais simples em produção, e está se tornando a nova norma.
Segurança como Prioridade
Aparentemente havia mais tópicos sobre segurança e garantias na conferência do que um ano antes. Na ICLR 2025, isto era exótico. Em 2026 — mainstream. Os pesquisadores falam sobre o fato de que os grandes modelos precisam ser treinados não apenas para desempenho, mas também para robustez: resistência a exemplos adversariais, a mudanças de distribuição, a tentativas de manipulação.
"Não podemos mais lançar um modelo e esperar que ninguém o quebre em
condições de combate" — uma posição típica nos painéis de discussão da conferência.
Não se trata apenas de regulação (embora os estados estejam criando novos requisitos). É sobre o fato de que a comunidade científica se deu conta: a corrida por resultados SOTA é perigosa se você não contabilizar os custos reais do dano.
Pesos Abertos à Sombra dos Sistemas Corporativos
A questão mais contenciosa da conferência: o código aberto em IA terá uma chance se Anthropic, OpenAI e Meta mantiverem os modelos mais avançados fechados? Na ICLR, havia uma opinião dividida. Uma parte da comunidade científica insiste: modelos abertos são infraestrutura crítica que deve ser desenvolvida apesar dos riscos. A outra já é realista: as corporações terão os melhores modelos, têm recursos para treinamento e responsabilidade perante os investidores. A ciência aberta pode permanecer em um papel de apoio — desenvolvendo metodologia, mas não mantendo a linha de frente.
O Que Isto Significa
ICLR 2026 mostrou: a era do dimensionamento exponencial está terminando, mas a IA não está desacelerando — a direção está mudando. À frente está a era da otimização sistêmica: como usar recursos de forma mais eficiente, como tornar os modelos mais confiáveis, como a ciência aberta pode permanecer relevante. Para startups e engenheiros, isso significa: vantagem competitiva agora não está em treinar um modelo grande a mais, mas em implantar os modelos existentes de forma mais barata, rápida e segura.
*Meta é reconhecida como uma organização extremista e proibida na Rússia.