IBM a lancé Mellea 0.4.0 et Granite Libraries pour des pipelines d'AI vérifiables
IBM Research a mis à jour Mellea vers la version 0.4.0 et a simultanément lancé trois Granite Libraries — des adaptateurs LoRA spécialisés pour les modèles…
Traité par IA depuis Hugging Face Blog ; édité par Hamidun News
IBM Research a lancé Mellea 0.4.0 et présenté simultanément trois Granite Libraries — ensembles d'adaptateurs spécialisés pour les modèles Granite. La version cible ceux qui construisent non pas simplement des chatbots, mais des pipelines d'IA gérés avec vérification de structure, vérification des faits et conformité aux règles.
Ce qui a été mis à jour
Mellea est une bibliothèque Python open-source pour les « programmes génératifs » : au lieu du prompt engineering fragile, elle propose de construire des flux LLM à partir d'étapes prévisibles. IBM la positionne comme une alternative aux orchestrateurs polyvalents, où le comportement du modèle reste souvent probabiliste et peu reproductible. Le framework est nécessaire lorsque la sortie du modèle devient partie d'un processus métier, d'un rapport, d'un formulaire ou d'une chaîne d'actions d'agents. La version 0.4.0 développe les idées de la version 0.3.0 et élargit la palette de blocs de construction pour de tels scénarios.
La nouvelle version introduit une couche d'intégration native avec Granite Libraries via une API standardisée. L'accent clé est sur le constrained decoding, pour que les réponses se conforment à un schéma donné plutôt que de simplement « ressembler » à du JSON correct. Un autre motif important est instruct-validate-repair : le système génère d'abord une réponse, puis la valide et, si nécessaire, lance une correction. Selon les notes de version, Mellea a également reçu le support des hooks et plugins, l'export de logs via OTLP, les métriques pour Prometheus et OpenTelemetry, ainsi que le suivi de la consommation de tokens et des événements au niveau du pipeline.
Ce qui fait partie de Granite Libraries
Granite Libraries n'est pas un autre grand modèle universel, mais un ensemble d'adaptateurs LoRA pour granite-4.0-micro. Chaque adaptateur est entraîné sur une opération étroite au sein de la chaîne : réécrire une requête, vérifier le respect des exigences, évaluer la factualité, ajouter des citations ou surveiller les violations de politique. Cette approche permet de renforcer les étapes individuelles du pipeline sans réentraînement complet du modèle de base. IBM souligne particulièrement que cela apporte des gains de précision à un coût modéré en paramètres sans casser les capacités essentielles de Granite.
- granitelib-core-r1.0 — adaptateurs pour la vérification des exigences, l'évaluation de la confiance des réponses et l'explicabilité par attribution de contexte.
- granitelib-rag-r1.0 — outils pour RAG agentic : reformulation de requête, clarification de requête, vérification de la pertinence du contexte, évaluation de la répondabilité, détection des hallucinations et génération de citations.
- granitelib-guardian-r1.0 — modules pour la sécurité, la factualité et la conformité aux politiques, incluant la correction de factualité et des guardrails séparés.
- Toutes les bibliothèques fonctionnent sur granite-4.0-micro, et l'ensemble RAG est publié comme un paquet compact d'environ 14,4 millions de paramètres.
En pratique, cela signifie qu'un développeur n'a pas besoin de forcer un modèle à faire tout aussi bien. À la place, Mellea orchestre des « modules » spécialisés aux bons endroits : avant retrieval, avant génération, après génération et à la vérification finale. Pour les scénarios entreprise, c'est particulièrement utile quand on a besoin de suivre démontrablement un schéma, de ne pas répondre à une question insoluble, de fournir des citations pour chaque affirmation ou de montrer quels fragments de contexte le système a réellement utilisés.
Pourquoi cette version est importante
L'idée principale de cette version est un passage d'un « modèle intelligent avec un grand prompt » à une architecture modulaire, où la qualité est contrôlée à chaque étape. Cela s'aligne bien avec les tâches produit réelles : copilots internes, recherche RAG sur documents, assistants avec tool calling, vérifications de conformité et tout scénario où une erreur ne devrait pas seulement être remarquée par l'utilisateur mais capturée automatiquement par le système. Pour les secteurs audités comme la finance, la médecine ou la gestion de documents d'entreprise, cette approche est particulièrement pragmatique.
L'observabilité se distingue particulièrement. Si une pile LLM dispose de callbacks, de télémétrie, de métriques OpenTelemetry et d'export vers Prometheus, une équipe peut déjà la gérer comme un service de production ordinaire : voir où les tokens sont perdus, à quelle étape la validation échoue, quels adaptateurs déclenchent le plus souvent un cycle de réparation. Cela simplifie non seulement le débogage, mais aussi l'exploitation : les fonctions d'IA commencent à ressembler à un service mesurable, pas à une boîte noire avec de bonnes démos. Pour les équipes passant les pilotes en production, c'est souvent plus important que le prochain gain benchmark.
Un autre mouvement fort d'IBM est de parier sur des adaptateurs spécialisés plutôt que d'enfler le modèle de base pour chaque tâche. Core a l'évaluation d'incertitude et la vérification des exigences, RAG a la gestion des requêtes, la pertinence et les citations, Guardian a les vérifications de sécurité, de factualité et de conformité aux politiques. Ensemble, cela transforme Granite non pas simplement en modèle, mais en un ensemble de primitives appliquées pour construire des systèmes d'IA contrôlés. De fait, une partie du QA manuel et du tuning de prompt est déplacée ici vers des composants séparés et vérifiables.
Ce que cela signifie
IBM mise non pas sur « un autre chat », mais sur l'infrastructure pour les processus d'IA vérifiables. Si l'approche Mellea et Granite Libraries prend racine, le marché s'éloignera plus rapidement du prompt engineering manuel vers une façon plus engineering-driven, modulaire et auditable de construire des produits LLM, où ce qui importe n'est pas seulement la qualité de la réponse, mais aussi la capacité à expliquer, vérifier et si nécessaire, corriger automatiquement avant de livrer à l'utilisateur.
Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?
AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.