IBM a lancé Granite Embedding R2 — un modèle multilingue pour la recherche sémantique
IBM a présenté Granite Embedding Multilingual R2, un modèle multilingue ouvert pour la recherche sémantique avec une prise en charge de 32 000 tokens. Le modèle

IBM a présenté Granite Embedding Multilingual R2 — un modèle multilingue open-source pour la recherche sémantique sous la licence Apache 2.0. Selon les tests sur des benchmarks populaires, ce développement domine dans la catégorie des modèles avec moins de 100 millions de paramètres.
Qu'est-ce que ce modèle
Les modèles d'embedding transforment le texte en vecteurs — des ensembles de nombres qui stockent l'information sur le sens du texte. C'est la base des systèmes RAG (Retrieval Augmented Generation) : d'abord, un tel modèle trouve des documents pertinents dans une base de données, puis un grand modèle génératif crée une réponse basée sur ces informations. Granite R2 supporte un contexte de 32 mille tokens — quatre fois plus que les modèles d'embedding standard. Cela signifie que le modèle peut analyser simultanément des chapitres entiers et des documents complets, en trouvant les informations nécessaires pour la recherche.
Caractéristiques techniques
Le modèle a été entraîné sur des données de plus de 30 langues, mais fonctionne comme un seul réseau universel sans adaptateurs spéciaux. Selon les résultats des tests sur MTEB et autres benchmarks standard, R2 affiche les meilleures performances parmi tous les modèles de sa classe. Le principal avantage est la compacité. Moins de 100 millions de paramètres signifie que le modèle fonctionne sur du matériel simple : un ordinateur portable de développeur, un GPU léger ou même un CPU suffit :
- 30+ langues dans un seul modèle
- Contexte de 32K tokens au lieu des 8K typiques
- Moins de 100M paramètres — rapide sur du matériel standard
- Licence Apache 2.0 — usage commercial autorisé
Pourquoi c'est nécessaire
Auparavant, le choix était simple : des modèles légers open-source de qualité médiocre ou des API cloud fermées nécessitant une connexion internet et de l'argent. Granite R2 casse ce stéréotype. Pour les entreprises, cela signifie un contrôle total sur les données — tout fonctionne localement sans le cloud. Pour les startups — intégration simple et mise à l'échelle moins chère. Aucune dépendance envers les quotas des fournisseurs, aucun délai de requête réseau.
«
Le développement open-source signifie que la communauté peut améliorer le modèle et l'adapter à des langues et des domaines spécifiques. »
Qu'est-ce que cela signifie
Les modèles d'embedding multilingues ont atteint ce niveau de maturité où il est pratique de les utiliser dans des projets réels. Pour les développeurs de systèmes RAG, cela signifie moins de dépendances envers les géants du cloud et plus de flexibilité dans l'intégration. L'industrie passe progressivement des API cloud aux solutions locales.