Liquid AI desafia a corrida por modelos maiores: a arquitetura híbrida do LFM2 muda as regras
A Liquid AI lançou o LFM2-24B-A2B, um modelo de linguagem com 24 bilhões de parâmetros e arquitetura híbrida que combina mecanismos de atenção e camadas…
Processado por IA de MarkTechPost; editado por Hamidun News
Nos últimos anos, a indústria de grandes modelos de linguagem operava com um princípio simples: mais parâmetros significam melhores resultados. OpenAI aumentou o GPT, Google expandiu o Gemini, Meta ampliou o Llama. Mas em 2026, essa abordagem está cada vez mais esbarrando em limitações físicas — consumo de energia de data centers, custos de memória, velocidade de inferência. A startup Liquid AI de Boston acredita ter encontrado uma saída para esse impasse, e seu novo modelo LFM2-24B-A2B não é apenas mais um lançamento, mas uma declaração de revolução arquitetural.
Liquid AI é uma empresa que surgiu de pesquisas do MIT em chamadas "redes neurais líquidas" (liquid neural networks), inspiradas em sistemas nervosos biológicos. Diferentemente dos transformers clássicos, onde cada camada executa uma operação fixa, as redes líquidas são capazes de adaptar seus cálculos dependendo dos dados de entrada. Esta é uma abordagem fundamentalmente diferente do processamento de informações, e a equipe a vem desenvolvendo consistentemente há vários anos. LFM2-24B-A2B tornou-se o auge desse trabalho — um modelo com 24 bilhões de parâmetros, construído em uma arquitetura híbrida que combina o mecanismo clássico de atenção (attention) com operações convolucionais.
Para entender por que isso é importante, é preciso compreender o problema. Os transformers padrão, que fundamentam GPT, Claude e outros modelos, usam um mecanismo de auto-atenção que permite a cada token "olhar" para todos os outros tokens no contexto. Esta é uma ferramenta poderosa, mas sua complexidade computacional cresce quadraticamente com o comprimento do contexto. Dobre o tamanho da janela de contexto — e você obtém um aumento quatro vezes nos custos computacionais. Por isso, trabalhar com documentos longos continua sendo uma das tarefas mais consumidoras de recursos para LLMs modernos. Camadas convolucionais, por outro lado, processam informações localmente e escalam linearmente, mas historicamente foram consideradas menos expressivas para tarefas de linguagem.
A abordagem híbrida da Liquid AI tenta pegar o melhor dos dois mundos. Os componentes convolucionais lidam com o processamento de padrões locais — estruturas sintáticas, dependências de curta distância, templates recorrentes. O mecanismo de atenção se engaja onde é necessário capturar conexões de longa distância no texto — referências a entidades previamente mencionadas, cadeias lógicas, raciocínio complexo. A designação "A2B" no nome do modelo aponta para uma configuração específica desse equilíbrio entre blocos de atenção e convolução. Essencialmente, o modelo decide por si qual tipo de processamento aplicar a um fragmento particular de dados, tornando os cálculos significativamente mais eficientes.
Vinte e quatro bilhões de parâmetros é um número relativamente modesto pelos padrões de 2026, quando modelos de ponta operam com centenas de bilhões e até trilhões de parâmetros. Mas essa é precisamente a tese principal da Liquid AI: eficiência arquitetural importa mais que força bruta. Se um modelo com 24 bilhões de parâmetros consegue competir com modelos várias vezes maiores consumindo significativamente menos custos de inferência, isso muda a economia de toda a indústria. Menos GPUs para atender solicitações — custos de API mais baixos. Menor consumo de energia — mais fácil implantar o modelo em dispositivos periféricos. Inferência mais rápida — melhor experiência do usuário.
Para a indústria como um todo, o lançamento do LFM2-24B-A2B se encaixa em uma tendência mais ampla. Mais e mais grupos de pesquisa e empresas estão chegando à conclusão de que a era do "escalonamento burro" está terminando. Mamba e outras arquiteturas baseadas em espaço de estado, trabalhos em modelos esparsos com Mixture of Experts, quantização e destilação — tudo isso são tentativas de extrair mais inteligência de menos computações. Liquid AI segue seu próprio caminho, e sua abordagem híbrida parece uma das soluções mais elegantes para o problema.
Dito isso, é bom manter um ceticismo saudável. Benchmarks completos do LFM2-24B-A2B ainda precisam ser estudados e reproduzidos independentemente. Inovações arquitetorais geralmente parecem impressionantes no papel, mas encontram problemas inesperados ao serem dimensionadas em produção — desde complexidade de treinamento até compatibilidade com a infraestrutura de otimização existente. O ecossistema de ferramentas em torno dos transformers foi construído ao longo dos anos, e qualquer arquitetura alternativa precisará comprovar sua viabilidade não apenas no laboratório.
No entanto, a direção que Liquid AI está marcando parece inevitável. A indústria de inteligência artificial chegou a um ponto em que adicionar mais parâmetros gera retornos decrescentes, e as demandas por eficiência energética e velocidade apenas crescem. Empresas que encontrarem maneiras de fazer mais com menos recursos definirão o próximo capítulo no desenvolvimento de IA. E arquiteturas híbridas como o LFM2 bem poderiam ser a chave para esse futuro.
Quer parar de ler sobre IA e começar a usar?
AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.