Hugging Face Blog→ original

IBM lançou Granite Embedding R2 — um modelo multilíngue para busca semântica

A IBM apresentou Granite Embedding Multilingual R2, um modelo multilíngue aberto para busca semântica com suporte a 32 mil tokens. O modelo é licenciado sob Apa

IBM lançou Granite Embedding R2 — um modelo multilíngue para busca semântica
Fonte: Hugging Face Blog. Colagem: Hamidun News.
◐ Ouvir artigo

A IBM apresentou o Granite Embedding Multilingual R2 — um modelo de código aberto multilíngue para busca semântica sob a licença Apache 2.0. De acordo com testes em benchmarks populares, o desenvolvimento lidera na categoria de modelos com menos de 100 milhões de parâmetros.

O que é este modelo

Modelos de embedding transformam texto em vetores — conjuntos de números que armazenam informações sobre o significado do texto. Esta é a base para sistemas RAG (Retrieval Augmented Generation): primeiro, tal modelo encontra documentos relevantes em um banco de dados, depois um grande modelo generativo cria uma resposta baseada nessas informações. O Granite R2 suporta um contexto de 32 mil tokens — quatro vezes mais do que modelos de embedding padrão. Isso significa que o modelo pode analisar simultaneamente capítulos inteiros e documentos completos, encontrando as informações necessárias para a busca.

Características técnicas

O modelo foi treinado em dados de mais de 30 idiomas, mas funciona como uma rede universal única sem adaptadores especiais. Com base nos resultados dos testes no MTEB e outros benchmarks padrão, o R2 mostra o melhor desempenho entre todos os modelos de sua classe. A principal vantagem é a compacidade. Menos de 100 milhões de parâmetros significa que o modelo funciona em hardware simples: um laptop de desenvolvedor, uma GPU leve ou até um CPU é suficiente:

  • 30+ idiomas em um modelo
  • Contexto de 32K tokens em vez dos típicos 8K
  • Menos de 100M parâmetros — rápido em hardware padrão
  • Licença Apache 2.0 — uso comercial permitido

Por que isso é necessário

Antes, a escolha era simples: modelos leves de código aberto com qualidade medíocre ou APIs em nuvem fechadas que exigem internet e dinheiro. O Granite R2 quebra este estereótipo. Para corporações, significa controle completo sobre os dados — tudo funciona localmente sem a nuvem. Para startups — integração simples e dimensionamento mais barato. Sem dependência de cotas de provedores, sem atrasos de requisições de rede.

"Desenvolvimento de código aberto significa que a comunidade pode

melhorar o modelo e adaptá-lo para idiomas e domínios específicos."

O que isso significa

Modelos de embedding multilíngues atingiram esse nível de maturidade em que são convenientes de usar em projetos reais. Para desenvolvedores de sistemas RAG, isso significa menos dependências de gigantes em nuvem e mais flexibilidade na integração. A indústria está gradualmente passando de APIs em nuvem para soluções locais.

ZK
Hamidun News
Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.
O que você acha?
Carregando comentários…