Dernières publications

Hugging Face a publié une Skill pour porter rapidement des modèles de Transformers vers MLX
Hugging Face a présenté une Skill et un test harness distinct pour porter presque immédiatement de nouveaux modèles de Transformers vers mlx-lm sur MLX, sans flux de PR bruts générés par AI.

IBM Research a analysé où les agents AI échouent face aux API, aux documents et aux règles dans VAKRA
L'analyse de VAKRA par IBM Research montre que même les modèles performants perdent en fiabilité lorsqu'ils doivent combiner des API, des documents, un raisonnement en plusieurs étapes et des contraintes sur les outils.

Hugging Face a publié Ecom-RLVE, un environnement d'entraînement pour les agents AI du e-commerce
Hugging Face a publié Ecom-RLVE, un environnement open source où des agents AI apprennent à mener un dialogue d'achat, à utiliser des outils et à obtenir une récompense vérifiable pour le panier qu'ils constituent réelle

TII a présenté QIMMA — un leaderboard pour les LLM arabes avec vérification de la qualité des benchmarks
TII a lancé QIMMA, un leaderboard pour les LLM arabes qui vérifie d'abord les benchmarks eux-mêmes avant de comparer les modèles sur 52 000 exemples issus de sept domaines.

NVIDIA a présenté Nemotron OCR v2 : un OCR multilingue entraîné sur 12,2 millions de documents synthétiques
NVIDIA a montré comment elle a conçu Nemotron OCR v2 : le modèle a été entraîné sur 12,2 millions de documents synthétiques afin de reconnaître plusieurs langues avec un seul moteur et de traiter jusqu'à 34,7 pages par s

NVIDIA a montré comment Gemma 4 avec voix et webcam fonctionne sur Jetson Orin Nano Super
NVIDIA a publié une démo dans laquelle Gemma 4 décide lui-même quand activer la webcam et répond oralement — le tout en local sur Jetson Orin Nano Super avec 8 Go de mémoire.

NVIDIA présente NeMo Retriever — recherche agentique pour des données d'entreprise complexes
NVIDIA a présenté un pipeline agentique dans NeMo Retriever : le système ne se limite pas à la recherche sémantique, il planifie des étapes, affine les requêtes et a déjà pris la première place dans ViDoRe v3.

Nvidia a présenté le premier dataset ouvert et des modèles fondamentaux d’AI pour les robots médicaux
Nvidia et ses partenaires sur Hugging Face ont rendu public le premier grand dataset pour les robots médicaux et publié deux modèles fondamentaux pour la chirurgie, la simulation et l’autonomie future.

NVIDIA a lancé Nemotron 3 Nano 4B — un modèle hybride compact pour fonctionner sur les appareils
NVIDIA a rendu disponible le modèle Nemotron 3 Nano 4B avec une architecture hybride Mamba-Transformer : la plus faible consommation de VRAM de sa catégorie, 18 tokens/s sur Jetson Orin Nano et des poids ouverts.

Hugging Face : les modèles open-source chinois dépassent les États-Unis en téléchargements dans l’écosystème AI
Hugging Face a montré que l’AI open-source a presque doublé de taille en un an, tandis que les modèles chinois représentent déjà 41 % des téléchargements et donnent le rythme en matière de sorties, d’adaptation et de dép

L'Évaluation des Modèles d'IA Coûte Désormais Plus Cher que Leur Entraînement — Un Nouveau Frein pour les Chercheurs
EvalEval Coalition a analysé le coût des benchmarks d'IA : un seul test d'agent coûte 40 000 $ ou plus, et les groupes académiques ne peuvent plus se permettre une évaluation indépendante.

IBM révèle comment elle a construit Granite 4.1 : 15 trillions de tokens, contexte de 512K et focus sur la qualité
IBM a détaillé son approche pour entraîner Granite 4.1 : cinq étapes de préentraînement, 15 trillions de tokens, fenêtre de contexte jusqu'à 512K et pipelines SFT et RL séparés pour l'amélioration de la qualité.

Hugging Face ajoute DeepInfra aux Inference Providers pour exécuter des modèles via une API unifiée
Hugging Face a connecté DeepInfra aux Inference Providers : les modèles DeepSeek, Kimi et GLM peuvent désormais être exécutés à partir des pages du Hub, via le SDK et à travers le routeur unifié sans intégration séparée.

NVIDIA a présenté Nemotron 3 Nano Omni pour les documents longs, l'audio, la vidéo et les agents IA
NVIDIA a présenté Nemotron 3 Nano Omni — un modèle multimodal ouvert pour les documents longs, l'audio, la vidéo et les scénarios GUI mettant l'accent sur la vitesse et le contexte.

Hugging Face Explique le Fine-tuning des Embeddings Multimodaux et des Modèles Reranker
Hugging Face a publié un guide pratique sur l'entraînement des modèles d'embedding et reranker multimodaux dans Sentence Transformers et a démontré comment l'ajustement fin spécifique au domaine améliore la récupération

Comment Hugging Face Construit des Applications Web Scalables avec Privacy Filter d'OpenAI
Hugging Face a démontré trois scénarios pour OpenAI Privacy Filter : lecture de documents avec mise en évidence des PII, anonymisation d'images et pastebin sécurisé avec versions publique et privée.

Hugging Face : l’AI open source donne aux défenseurs les mêmes capacités qu’aux attaquants
Hugging Face explique pourquoi les modèles et les outils ouverts constituent un avantage structurel en cybersécurité, et non une menace.

Hugging Face a entraîné un modèle de génération d'images en 24 heures
La troisième partie du projet PRX de Hugging Face montre qu'un modèle text-to-image complet peut être entraîné en seulement 24 heures. Cela change la perception de l'accessibilité de l'AI générative.

NVIDIA Nemotron 2 Nano 9B : une nouvelle référence pour l'IA souveraine au Japon
NVIDIA a présenté le modèle de langage compact Nemotron 2 Nano 9B, optimisé spécifiquement pour la langue japonaise et le concept d'IA souveraine.

SyGra Studio: l'IA symbolique tente de guérir les hallucinations des réseaux de neurones
Nous en avons tous un peu marre de la façon dont les réseaux de neurones modernes se comportent comme des stagiaires talentueux mais extrêmement irresponsables.

Holo2 de H Company: les interfaces vont enfin cesser de faire peur aux utilisateurs
La localisation d'interfaces a toujours été ce "boss final" pour les développeurs qui dévore les budgets et les nerfs.

Nemotron brésilien : pourquoi la Vallée de la Silicon ne dicte plus les règles
Nemotron Brésilien : Pourquoi la Silicon Valley ne dicte plus les règles Imaginez converser avec un interlocuteur incroyablement intelligent qui sait tout sur ce monde, mais voit le monde…

# AprielGuard : Une nouvelle frontière dans la protection des LLM contre les menaces et les attaques
Les grands modèles de langage modernes (LLM) démontrent des capacités impressionnantes, mais ils ouvrent également de nouveaux horizons pour les attaquants.