Éditeur · vérifié par la rédaction

Hugging Face Blog

Source d'actualités IA. Les articles sont sélectionnés et adaptés par la rédaction de Hamidun News.

65 articles dans Hamidun·Dernier: 23 juillet· Actif·huggingface.co ↗

Dernières publications

NVIDIA ouvre les datasets Nemotron : 10 000 milliards de tokens pour entraîner des agents AI

NVIDIA a publié les datasets Nemotron avec plus de 10 000 milliards de tokens et 2,4 milliards de personas synthétiques pour entraîner des agents AI sur des scénarios réels et des défaillances d’outils.

9 juil. 2026·3 min

LLMHugging Face Blog

Hugging Face : le backend transformers dans vLLM fonctionne désormais à vitesse native

Hugging Face a annoncé une parité de performances : le flag `--model-impl transformers` apporte la vitesse native de vLLM sur plus de 450 architectures sans réécriture du code.

8 juil. 2026·2 min

LLMHugging Face Blog

SkyPilot et Hugging Face ont lancé un stockage sans frais de trafic sortant

L’intégration de SkyPilot et Hugging Face Storage permet d’entraîner des modèles sur n’importe quel cloud, en stockant poids et jeux de données à $12-18/TB/mois sans frais de trafic sortant.

8 juil. 2026·2 min

LLMHugging Face Blog

Microsoft a lancé Foundry Managed Compute : des milliers de modèles Hugging Face d'un seul clic

Microsoft a combiné Azure Foundry avec le catalogue Hugging Face : des milliers de modèles ouverts se déploient maintenant dans le cloud d'un seul clic, avec la sécurité d'entreprise et la facturation unifiée.

8 juil. 2026·2 min

LLMHugging Face Blog

LeRobot v0.6.0 de Hugging Face : les robots apprennent à prédire l'avenir et à s'évaluer eux-mêmes

Hugging Face a lancé LeRobot v0.6.0 avec des politiques world-model, des modèles de récompense pour l'auto-évaluation des tâches et six nouveaux benchmarks — complétant le cycle d'apprentissage complet des robots.

6 juil. 2026·3 min

LLMHugging Face Blog

Hugging Face met à jour Kernels : éditeurs de confiance, signature de code et développement d'agents

Le 6 juillet 2026, Hugging Face a lancé une importante mise à jour de Kernels : les kernels sont devenus un type de référentiel distinct sur Hub, les éditeurs de confiance et la signature de code via Sigstore ont été ajo

6 juil. 2026·3 min

LLMHugging Face Blog

Hugging Face et Cerebras lancent Gemma 4 pour l’AI vocale en temps réel

Hugging Face et Cerebras ont présenté un pipeline ouvert de parole à parole sur Gemma 4 avec des latences prévisibles — le système est déjà utilisé dans plus de 9 000 robots Reachy Mini.

4 juil. 2026·2 min

LLMHugging Face Blog

Hugging Face compare toutes les alternatives à LoRA : qui l'emporte dans le fine-tuning des LLM

L'équipe de Hugging Face a testé cinq méthodes PEFT de fine-tuning des LLM — de DoRA à GaLore — et a découvert quand il est possible de surpasser LoRA, et à quel prix exactement.

29 juin 2026·2 min

LLMHugging Face Blog

ServiceNow : un agent IA divulgue des secrets d'entreprise via une chaîne de requêtes de recherche

Des chercheurs de ServiceNow ont montré qu'un agent de deep-research révèle involontairement des secrets d'entreprise — chaque requête est anodine, mais l'ensemble de la chaîne forme une mosaïque.

29 juin 2026·3 min

LLMHugging Face Blog

PaddleOCR lance PP-OCRv6 : reconnaissance de texte en 50 langues, de 1,5 à 34,5 millions de paramètres

PP-OCRv6 de Baidu PaddlePaddle : un OCR universel pour 50 langues en trois configurations de 1,5 à 34,5 millions de paramètres, avec un gain de précision de +4,6 à 5,1 points de pourcentage par rapport à la précédente ve

29 juin 2026·2 min

LLMHugging Face Blog

Les modèles hybrides prédisent mieux les mots de contenu que les transformers — étude d'Allen AI

Allen AI a comparé les architectures OLMo 3 et OLMo Hybrid : les modèles hybrides prédisent plus précisément les noms, verbes et adjectifs, mais restent en retrait par rapport aux transformers sur les fragments de texte

28 juin 2026·2 min

LLMHugging Face Blog

Hugging Face : lancer un serveur vLLM sur HF Jobs est désormais possible en une seule commande

Hugging Face a ajouté la prise en charge de vLLM à la plateforme HF Jobs : un serveur d’inférence prêt pour la production pour n’importe quel modèle du Hub peut désormais être déployé avec une seule commande CLI.

28 juin 2026·2 min

LLMHugging Face Blog

AllenAI Lance olmo-eval — Une Plateforme pour Évaluer des LLM Pendant l'Entraînement

AllenAI a lancé olmo-eval, une suite d'outils ouverte pour l'évaluation continue des modèles de langage pendant tout le cycle d'entraînement — point de contrôle après point de contrôle.

15 juin 2026·2 min

LLMHugging Face Blog

Cohere présente North Mini Code — un modèle pour les développeurs et les agents IA

Cohere a lancé North Mini Code — un modèle de 30 milliards de paramètres entraîné sur la programmation et l'interaction avec les agents IA. Le modèle est gratuit et accessible à tous.

11 juin 2026·3 min

LLMHugging Face Blog

Les agents vocaux ne sont pas prêts pour les clients bilingues. Recherche ServiceNow-AI

Les agents vocaux fonctionnent mal avec les clients bilingues. Cela a été démontré par une recherche de l'équipe ServiceNow-AI, qui a testé sept systèmes populaires de reconnaissance vocale sur des…

11 juin 2026·3 min

LLMHugging Face Blog

Comment accélérer les modèles PyTorch : guide pratique torch.profiler

Hugging Face présente torch.profiler, un outil intégré de PyTorch pour l'analyse de performance. Il aide à identifier les goulots d'étranglement dans l'entraînement et l'inférence des modèles.

29 mai 2026·3 min

LLMHugging Face Blog

Hugging Face apprend à TRL à livrer un trillion de paramètres via poids delta

Hugging Face a ajouté Delta Weight Sync à TRL — une technique qui envoie uniquement les modifications de poids au lieu de fichiers complets, réduisant le volume de données de centaines de fois lors de l'entraînement de m

29 mai 2026·2 min

LLMHugging Face Blog

Reachy Mini a appris à converser localement sans cloud

Le robot humanoïde Reachy Mini peut désormais exécuter toute la pile de reconnaissance vocale localement, sans cloud ni API, grâce aux modèles ouverts de Hugging Face.

29 mai 2026·3 min

LLMHugging Face Blog

IBM et Artificial Analysis créent un benchmark : les agents d'IA échouent aux tâches informatiques

Les grands modèles de langage ont obtenu moins de 50% au nouveau benchmark ITBench-AA pour évaluer la capacité des agents d'IA à résoudre les tâches informatiques d'entreprise. Cela montre que l'automatisation complète d

29 mai 2026·3 min

LLMHugging Face Blog

NVIDIA Nemotron : les modèles de diffusion génèrent le texte 6 fois plus vite

NVIDIA a présenté Nemotron-Labs Diffusion, les premiers modèles générant le texte en parallèle. En mode auto-spéculation, ils fonctionnent 6 fois plus vite grâce à la diffusion.

25 mai 2026·3 min

LLMHugging Face Blog

Comment un petit modèle a surpassé GPT-5 et Claude Opus en OCR portugais

Dharma AI a entraîné un modèle spécialisé de 3 milliards de paramètres surpassant tous les modèles frontier commerciaux en reconnaissance de texte, 52 fois moins cher.

25 mai 2026·3 min

LLMHugging Face Blog

Hugging Face a lancé Open Agent Leaderboard pour évaluer les agents AI

Hugging Face a présenté un benchmark ouvert pour comparer des systèmes complets d'agents AI. Il montre que l'architecture de l'agent compte davantage que le modèle choisi.

21 mai 2026·3 min

LLMHugging Face Blog

PaddleOCR 3.5 reçoit le support des Transformers de Hugging Face

PaddleOCR supporte désormais les Transformers de Hugging Face comme backend d'inférence. La reconnaissance de texte et l'analyse de documents fonctionnent dans un environnement PyTorch.

21 mai 2026·2 min

LLMHugging Face Blog

NVIDIA a montré un moyen efficace d'entraîner Cosmos sur des vidéos de robots via LoRA

NVIDIA a publié un guide pour l'ajustement fin du modèle Cosmos Predict 2.5 via LoRA/DoRA — une méthode paramétriquement efficace pour générer des vidéos de robots en 17 heures sur un seul GPU.

21 mai 2026·2 min

LLMHugging Face Blog

Ettin Reranker de Hugging Face : 6 modèles pour un réordonnement de recherche précis

Hugging Face a publié 6 réordonneurs Ettin basés sur ModernBERT avec une précision et une vitesse de pointe grâce à Flash Attention 2 et l'optimisation des séquences.

21 mai 2026·3 min

LLMHugging Face Blog

OlmoEarth v1.1 : Allen AI lance des modèles satellites 3 fois moins chers

Allen AI a présenté une version plus efficace des modèles d'analyse d'images satellites, réduisant les coûts de calcul de 3 fois tout en maintenant la qualité.

21 mai 2026·2 min

LLMHugging Face Blog

Comment le modèle d’Allen AI a appris à découvrir seul la spécialisation des experts

Allen AI a présenté EMO, un modèle fondé sur un mélange d’experts qui développe naturellement une spécialisation par domaine (santé, politique, cinéma) sans entraînement explicite sur ces catégories.

17 mai 2026·3 min

LLMHugging Face Blog

CyberSecQwen-4B : comment un petit modèle est devenu un expert des vulnérabilités

Ce modèle de cybersécurité spécialisé de 4 milliards de paramètres surpasse des concurrents généralistes dans l’analyse des vulnérabilités et fonctionne localement sur du matériel personnel sans services cloud.

17 mai 2026·3 min

LLMHugging Face Blog

OncoAgent : système d'AI de détection précoce du cancer basé sur des données privées de patients

Comment un algorithme d'apprentissage automatique aide les médecins à prendre des décisions sur le diagnostic du cancer sans compromettre la confidentialité des patients

17 mai 2026·3 min

LLMHugging Face Blog

Hugging Face a accéléré l’inférence LLM de 22% grâce au batching asynchrone

Le traitement parallèle du CPU et du GPU, au lieu d’un traitement séquentiel, a supprimé 24% du temps d’inactivité du GPU et accéléré la génération de tokens de près d’un quart sans modifier le modèle.

17 mai 2026·2 min