Éditeur · vérifié par la rédaction

Hugging Face Blog

Source d'actualités IA. Les articles sont sélectionnés et adaptés par la rédaction de Hamidun News.

65 articles dans Hamidun·Dernier: 23 juillet· Actif·huggingface.co ↗

Dernières publications

IBM a lancé Granite Embedding R2 — un modèle multilingue pour la recherche sémantique

IBM a présenté Granite Embedding R2, un modèle multilingue ouvert pour la recherche sémantique avec une prise en charge d'un contexte de 32K et les meilleures performances de sa catégorie parmi les modèles sub-100M.

16 mai 2026·3 min

LLMHugging Face Blog

H Company a publié Holotron-12B — un modèle pour agents avec une vitesse multipliée par deux

H Company a publié Holotron-12B sur Hugging Face : le modèle multimodal pour agents AI offre plus du double de throughput dans des tâches d'utilisation d'interfaces sur un seul H100.

2 mai 2026·3 min

LLMHugging Face Blog

NVIDIA a présenté SPEED-Bench — un benchmark unifié pour le speculative decoding

NVIDIA a publié SPEED-Bench, un jeu de données et un framework de mesure qui compare le speculative decoding sur des charges réelles, des contextes longs et différents moteurs d’inférence.

2 mai 2026·3 min

LLMHugging Face Blog

IBM a lancé Mellea 0.4.0 et Granite Libraries pour des pipelines d'AI vérifiables

IBM Research a mis à jour le framework open source Mellea vers la version 0.4.0 et a lancé trois Granite Libraries pour des flux de travail AI structurés, vérifiables et sûrs.

2 mai 2026·3 min

LLMHugging Face Blog

NVIDIA a montré comment affiner en une journée un modèle d'embedding pour un domaine spécifique

NVIDIA et Hugging Face ont publié une recette pas à pas qui transforme en quelques heures un modèle d'embedding de base en système de recherche spécialisé sur des documents internes.

2 mai 2026·3 min

LLMHugging Face Blog

ServiceNow a présenté EVA — un nouveau framework pour évaluer les agents vocaux AI

ServiceNow a lancé EVA — un système qui évalue les agents vocaux AI non seulement selon la réussite de la tâche, mais aussi selon la qualité du dialogue, de la brièveté des réponses au timing des prises de parole.

2 mai 2026·3 min

LLMHugging Face Blog

IBM lance Granite 4.0 3B Vision pour extraire des données de documents et de graphiques

IBM a présenté Granite 4.0 3B Vision, un modèle multimodal compact pour extraire des tableaux, des graphiques et des champs clés de documents, qui peut être intégré à des pipelines d'entreprise avec Docling.

2 mai 2026·2 min

LLMHugging Face Blog

H Company présente Holo3 — un agent AI pour travailler sur ordinateur avec un score record sur OSWorld-Verified

H Company a lancé Holo3, un modèle pour travailler sur ordinateur qui a obtenu 78,85 % sur OSWorld-Verified et a été entraîné sur des scénarios d’entreprise synthétiques.

2 mai 2026·3 min

LLMHugging Face Blog

Google a publié Gemma 4 sur Hugging Face : des modèles multimodaux pour l’exécution locale

Google DeepMind a ouvert la famille Gemma 4 sur Hugging Face : quatre modèles multimodaux sous licence Apache 2.0, avec jusqu’à 256K de contexte et une exécution allant du téléphone à la station de travail.

2 mai 2026·3 min

LLMHugging Face Blog

Hugging Face a ajouté gradio.Server : il est désormais possible de connecter son propre frontend à un backend Gradio

Le nouveau gradio.Server de Hugging Face transforme Gradio en couche backend pour React, Svelte et du HTML/JS classique, tout en conservant les files de requêtes, ZeroGPU et la compatibilité avec Spaces.

2 mai 2026·3 min

LLMHugging Face Blog

Hugging Face transfère Safetensors à la PyTorch Foundation pour une gouvernance neutre du format

Hugging Face a annoncé que Safetensors est devenu un projet de la PyTorch Foundation : il n'y a pas de changements incompatibles pour les utilisateurs, tandis que le développement du format passe à un modèle de gouvernan

2 mai 2026·3 min

LLMHugging Face Blog

Overworld a lancé Waypoint-1.5 : des mondes interactifs en 720p pour les GPU grand public

Overworld a lancé Waypoint-1.5, un world model pour une exécution locale sur des GPU grand public : jusqu'en 720p et 60 FPS, avec en plus une version 360p allégée pour un plus large éventail de PC et d'ordinateurs portab

2 mai 2026·3 min

LLMHugging Face Blog

Hugging Face a publié une Skill pour porter rapidement des modèles de Transformers vers MLX

Hugging Face a présenté une Skill et un test harness distinct pour porter presque immédiatement de nouveaux modèles de Transformers vers mlx-lm sur MLX, sans flux de PR bruts générés par AI.

2 mai 2026·3 min

LLMHugging Face Blog

IBM Research a analysé où les agents AI échouent face aux API, aux documents et aux règles dans VAKRA

L'analyse de VAKRA par IBM Research montre que même les modèles performants perdent en fiabilité lorsqu'ils doivent combiner des API, des documents, un raisonnement en plusieurs étapes et des contraintes sur les outils.

2 mai 2026·3 min

LLMHugging Face Blog

Hugging Face a publié Ecom-RLVE, un environnement d'entraînement pour les agents AI du e-commerce

Hugging Face a publié Ecom-RLVE, un environnement open source où des agents AI apprennent à mener un dialogue d'achat, à utiliser des outils et à obtenir une récompense vérifiable pour le panier qu'ils constituent réelle

2 mai 2026·3 min

LLMHugging Face Blog

TII a présenté QIMMA — un leaderboard pour les LLM arabes avec vérification de la qualité des benchmarks

TII a lancé QIMMA, un leaderboard pour les LLM arabes qui vérifie d'abord les benchmarks eux-mêmes avant de comparer les modèles sur 52 000 exemples issus de sept domaines.

2 mai 2026·3 min

LLMHugging Face Blog

NVIDIA a présenté Nemotron OCR v2 : un OCR multilingue entraîné sur 12,2 millions de documents synthétiques

NVIDIA a montré comment elle a conçu Nemotron OCR v2 : le modèle a été entraîné sur 12,2 millions de documents synthétiques afin de reconnaître plusieurs langues avec un seul moteur et de traiter jusqu'à 34,7 pages par s

2 mai 2026·3 min

LLMHugging Face Blog

NVIDIA a montré comment Gemma 4 avec voix et webcam fonctionne sur Jetson Orin Nano Super

NVIDIA a publié une démo dans laquelle Gemma 4 décide lui-même quand activer la webcam et répond oralement — le tout en local sur Jetson Orin Nano Super avec 8 Go de mémoire.

1 mai 2026·3 min

LLMHugging Face Blog

NVIDIA présente NeMo Retriever — recherche agentique pour des données d'entreprise complexes

NVIDIA a présenté un pipeline agentique dans NeMo Retriever : le système ne se limite pas à la recherche sémantique, il planifie des étapes, affine les requêtes et a déjà pris la première place dans ViDoRe v3.

30 avr. 2026·3 min

LLMHugging Face Blog

Nvidia a présenté le premier dataset ouvert et des modèles fondamentaux d’AI pour les robots médicaux

Nvidia et ses partenaires sur Hugging Face ont rendu public le premier grand dataset pour les robots médicaux et publié deux modèles fondamentaux pour la chirurgie, la simulation et l’autonomie future.

30 avr. 2026·3 min

LLMHugging Face Blog

NVIDIA a lancé Nemotron 3 Nano 4B — un modèle hybride compact pour fonctionner sur les appareils

NVIDIA a rendu disponible le modèle Nemotron 3 Nano 4B avec une architecture hybride Mamba-Transformer : la plus faible consommation de VRAM de sa catégorie, 18 tokens/s sur Jetson Orin Nano et des poids ouverts.

30 avr. 2026·2 min

LLMHugging Face Blog

Hugging Face : les modèles open-source chinois dépassent les États-Unis en téléchargements dans l’écosystème AI

Hugging Face a montré que l’AI open-source a presque doublé de taille en un an, tandis que les modèles chinois représentent déjà 41 % des téléchargements et donnent le rythme en matière de sorties, d’adaptation et de dép

30 avr. 2026·3 min

LLMHugging Face Blog

L'Évaluation des Modèles d'IA Coûte Désormais Plus Cher que Leur Entraînement — Un Nouveau Frein pour les Chercheurs

EvalEval Coalition a analysé le coût des benchmarks d'IA : un seul test d'agent coûte 40 000 $ ou plus, et les groupes académiques ne peuvent plus se permettre une évaluation indépendante.

30 avr. 2026·2 min

LLMHugging Face Blog

IBM révèle comment elle a construit Granite 4.1 : 15 trillions de tokens, contexte de 512K et focus sur la qualité

IBM a détaillé son approche pour entraîner Granite 4.1 : cinq étapes de préentraînement, 15 trillions de tokens, fenêtre de contexte jusqu'à 512K et pipelines SFT et RL séparés pour l'amélioration de la qualité.

30 avr. 2026·3 min

LLMHugging Face Blog

Hugging Face ajoute DeepInfra aux Inference Providers pour exécuter des modèles via une API unifiée

Hugging Face a connecté DeepInfra aux Inference Providers : les modèles DeepSeek, Kimi et GLM peuvent désormais être exécutés à partir des pages du Hub, via le SDK et à travers le routeur unifié sans intégration séparée.

30 avr. 2026·3 min

LLMHugging Face Blog

NVIDIA a présenté Nemotron 3 Nano Omni pour les documents longs, l'audio, la vidéo et les agents IA

NVIDIA a présenté Nemotron 3 Nano Omni — un modèle multimodal ouvert pour les documents longs, l'audio, la vidéo et les scénarios GUI mettant l'accent sur la vitesse et le contexte.

28 avr. 2026·3 min

LLMHugging Face Blog

Hugging Face Explique le Fine-tuning des Embeddings Multimodaux et des Modèles Reranker

Hugging Face a publié un guide pratique sur l'entraînement des modèles d'embedding et reranker multimodaux dans Sentence Transformers et a démontré comment l'ajustement fin spécifique au domaine améliore la récupération

28 avr. 2026·3 min

LLMHugging Face Blog

Comment Hugging Face Construit des Applications Web Scalables avec Privacy Filter d'OpenAI

Hugging Face a démontré trois scénarios pour OpenAI Privacy Filter : lecture de documents avec mise en évidence des PII, anonymisation d'images et pastebin sécurisé avec versions publique et privée.

27 avr. 2026·3 min

LLMHugging Face Blog

Hugging Face : l’AI open source donne aux défenseurs les mêmes capacités qu’aux attaquants

Hugging Face explique pourquoi les modèles et les outils ouverts constituent un avantage structurel en cybersécurité, et non une menace.

22 avr. 2026·2 min

LLMHugging Face Blog

Hugging Face a entraîné un modèle de génération d'images en 24 heures

La troisième partie du projet PRX de Hugging Face montre qu'un modèle text-to-image complet peut être entraîné en seulement 24 heures. Cela change la perception de l'accessibilité de l'AI générative.

3 mars 2026·2 min