IBM lançou Granite Embedding R2 — um modelo multilíngue para busca semântica
A IBM apresentou Granite Embedding Multilingual R2, um modelo multilíngue aberto para busca semântica com suporte a 32 mil tokens. O modelo é licenciado sob Apa

A IBM apresentou o Granite Embedding Multilingual R2 — um modelo de código aberto multilíngue para busca semântica sob a licença Apache 2.0. De acordo com testes em benchmarks populares, o desenvolvimento lidera na categoria de modelos com menos de 100 milhões de parâmetros.
O que é este modelo
Modelos de embedding transformam texto em vetores — conjuntos de números que armazenam informações sobre o significado do texto. Esta é a base para sistemas RAG (Retrieval Augmented Generation): primeiro, tal modelo encontra documentos relevantes em um banco de dados, depois um grande modelo generativo cria uma resposta baseada nessas informações. O Granite R2 suporta um contexto de 32 mil tokens — quatro vezes mais do que modelos de embedding padrão. Isso significa que o modelo pode analisar simultaneamente capítulos inteiros e documentos completos, encontrando as informações necessárias para a busca.
Características técnicas
O modelo foi treinado em dados de mais de 30 idiomas, mas funciona como uma rede universal única sem adaptadores especiais. Com base nos resultados dos testes no MTEB e outros benchmarks padrão, o R2 mostra o melhor desempenho entre todos os modelos de sua classe. A principal vantagem é a compacidade. Menos de 100 milhões de parâmetros significa que o modelo funciona em hardware simples: um laptop de desenvolvedor, uma GPU leve ou até um CPU é suficiente:
- 30+ idiomas em um modelo
- Contexto de 32K tokens em vez dos típicos 8K
- Menos de 100M parâmetros — rápido em hardware padrão
- Licença Apache 2.0 — uso comercial permitido
Por que isso é necessário
Antes, a escolha era simples: modelos leves de código aberto com qualidade medíocre ou APIs em nuvem fechadas que exigem internet e dinheiro. O Granite R2 quebra este estereótipo. Para corporações, significa controle completo sobre os dados — tudo funciona localmente sem a nuvem. Para startups — integração simples e dimensionamento mais barato. Sem dependência de cotas de provedores, sem atrasos de requisições de rede.
"Desenvolvimento de código aberto significa que a comunidade pode
melhorar o modelo e adaptá-lo para idiomas e domínios específicos."
O que isso significa
Modelos de embedding multilíngues atingiram esse nível de maturidade em que são convenientes de usar em projetos reais. Para desenvolvedores de sistemas RAG, isso significa menos dependências de gigantes em nuvem e mais flexibilidade na integração. A indústria está gradualmente passando de APIs em nuvem para soluções locais.