Éditeur · vérifié par la rédaction

MarkTechPost

Source d'actualités IA. Les articles sont sélectionnés et adaptés par la rédaction de Hamidun News.

221 articles dans Hamidun·Dernier: 15 juin· Actif·marktechpost.com ↗

Dernières publications

Zyphra a lancé le premier modèle de diffusion MoE avec une accélération de 7.7x
LLMMarkTechPost

Zyphra a lancé le premier modèle de diffusion MoE avec une accélération de 7.7x

Zyphra a présenté ZAYA1-8B-Diffusion-Preview, le premier modèle de diffusion MoE converti à partir d'un LLM. L'inférence a été accélérée de 7.7x en déplaçant les calculs de la mémoire vers le processeur GPU.

16 mai 2026·3 min
Comment construire un système de style MCP pour des agents AI intelligents
LLMMarkTechPost

Comment construire un système de style MCP pour des agents AI intelligents

Guide complet pour construire un système d'agents AI qui ouvre lui-même les bons outils, route les tâches et les exécute étape par étape.

16 mai 2026·3 min
BerriAI a lancé LiteLLM Agent Platform pour les agents en production
LLMMarkTechPost

BerriAI a lancé LiteLLM Agent Platform pour les agents en production

Exécuter un agent IA dans un script local est simple. L'exécuter de manière fiable en production, synchroniser entre les redémarrages, fournir des environnements isolés pour différents…

16 mai 2026·3 min
Repowise pour l’analyse de dépôts : analyse de graphe et code mort
LLMMarkTechPost

Repowise pour l’analyse de dépôts : analyse de graphe et code mort

Repowise aide les développeurs à analyser des dépôts de code à l’échelle de l’ensemble du projet : construction de graphes de dépendances, recherche de code mort et contexte pour AI.

16 mai 2026·3 min
NVIDIA présente SANA-WM : un modèle pour des vidéos de 60 secondes en 720p sur un seul GPU
LLMMarkTechPost

NVIDIA présente SANA-WM : un modèle pour des vidéos de 60 secondes en 720p sur un seul GPU

NVIDIA a présenté SANA-WM, un world model ouvert qui génère des vidéos de 60 secondes en 720p avec un contrôle précis de la caméra sur un seul GPU.

16 mai 2026·3 min
Comment construire un agent de prise de décision en streaming avec replanification en ligne dans un environnement dynamique
LLMMarkTechPost

Comment construire un agent de prise de décision en streaming avec replanification en ligne dans un environnement dynamique

Un tutoriel détaillé sur la création d’un agent de prise de décision en streaming qui s’adapte à des obstacles en mouvement et à des objectifs changeants en temps réel.

3 mai 2026·2 min
Outlines et Pydantic : comment construire des pipelines LLM sûrs du point de vue des types avec des schémas stricts
LLMMarkTechPost

Outlines et Pydantic : comment construire des pipelines LLM sûrs du point de vue des types avec des schémas stricts

Un nouveau guide sur Outlines et Pydantic montre comment assembler des pipelines LLM avec un schéma strict, des types de données, la récupération de JSON et des appels de fonction validés.

2 mai 2026·2 min
Volcengine lance OpenViking — une base de contexte basée sur des fichiers pour des agents AI comme OpenClaw
LLMMarkTechPost

Volcengine lance OpenViking — une base de contexte basée sur des fichiers pour des agents AI comme OpenClaw

OpenViking de Volcengine propose de stocker la mémoire, les ressources et les compétences d'un agent AI sous forme de système de fichiers afin de simplifier la recherche de contexte, de réduire la consommation de tokens

2 mai 2026·3 min
Diffrax et JAX : guide pratique des ODE, des simulations stochastiques et de neural ODE
LLMMarkTechPost

Diffrax et JAX : guide pratique des ODE, des simulations stochastiques et de neural ODE

Une nouvelle analyse de Diffrax et JAX présente tout le parcours, de la configuration de l'environnement de calcul et des solveurs ODE adaptatifs aux simulations stochastiques, au batching avec vmap et à l'entraînement d

2 mai 2026·2 min
BM25 vs RAG : pourquoi la recherche par mots-clés et la recherche sémantique donnent des réponses différentes
LLMMarkTechPost

BM25 vs RAG : pourquoi la recherche par mots-clés et la recherche sémantique donnent des réponses différentes

L’analyse montre comment BM25 classe les documents selon la fréquence et la rareté des mots, tandis que RAG avec des embeddings cherche par sens, d’où la combinaison croissante des deux approches en production.

2 mai 2026·3 min
Meta a lancé Tribe v2 — un modèle qui prédit la réponse du cerveau à la vidéo, à l'audio et au texte
LLMMarkTechPost

Meta a lancé Tribe v2 — un modèle qui prédit la réponse du cerveau à la vidéo, à l'audio et au texte

Meta a publié Tribe v2 en open source, un modèle qui prédit la réponse fMRI du cerveau à partir de vidéo, d'audio et de texte, et donne aux neurobiologistes un outil pour des expériences virtuelles sans nouveaux scans.

2 mai 2026·3 min
Google ADK présente un pipeline multi-agent d’analyse de données, de graphiques et de rapports en Python
LLMMarkTechPost

Google ADK présente un pipeline multi-agent d’analyse de données, de graphiques et de rapports en Python

Un nouveau guide montre comment assembler sur Google ADK un système multi-agent pour charger des tableaux, exécuter des tests statistiques, produire des visualisations et générer automatiquement des rapports en Python.

2 mai 2026·3 min
Google permet à Gemini API de combiner Search, Maps et des fonctions personnalisées dans une seule requête
LLMMarkTechPost

Google permet à Gemini API de combiner Search, Maps et des fonctions personnalisées dans une seule requête

Google a mis à jour Gemini API : un seul appel peut désormais combiner Google Search, Google Maps et des fonctions personnalisées, ce qui permet de créer des workflows agentiques en plusieurs étapes sans code d’intégrati

2 mai 2026·2 min
OpenClaw : comment mettre en place un runtime local et sécurisé pour des agents AI sans passer par le cloud
LLMMarkTechPost

OpenClaw : comment mettre en place un runtime local et sécurisé pour des agents AI sans passer par le cloud

Le nouveau guide d'OpenClaw montre comment mettre en place un runtime local-first pour un agent AI : gateway sur loopback, accès au modèle via des variables d'environnement, exec contrôlé et skills déterministes.

2 mai 2026·3 min
Microsoft a montré comment exécuter VibeVoice pour l'ASR, le realtime TTS et le speech-to-speech
LLMMarkTechPost

Microsoft a montré comment exécuter VibeVoice pour l'ASR, le realtime TTS et le speech-to-speech

Microsoft a publié un guide Colab pratique sur VibeVoice : il détaille pas à pas le speaker-aware ASR, le realtime TTS, le traitement audio par lots et la construction d'un pipeline speech-to-speech.

2 mai 2026·3 min
Hugging Face et Lambda : comment parser et fine-tuner des reasoning traces d’agents
LLMMarkTechPost

Hugging Face et Lambda : comment parser et fine-tuner des reasoning traces d’agents

MarkTechPost a publié un guide pratique sur le dataset lambda/hermes-agent-reasoning-traces : comment parser les pensées de l’agent, les appels d’outils, produire des graphiques et préparer les données pour le fine-tunin

2 mai 2026·2 min
Alibaba publie Qwen3.6-35B-A3B — un modèle MoE multimodal axé sur le codage agentique
LLMMarkTechPost

Alibaba publie Qwen3.6-35B-A3B — un modèle MoE multimodal axé sur le codage agentique

Qwen a publié les poids de Qwen3.6-35B-A3B : avec 35 milliards de paramètres et 3 milliards actifs, le modèle traite du code, des images et de la vidéo, en misant sur le tool use, le contexte long et les scénarios agenti

2 mai 2026·3 min
Microsoft, NVIDIA et IBM figurent dans la liste des 19 principaux outils d'AI red teaming de 2026
LLMMarkTechPost

Microsoft, NVIDIA et IBM figurent dans la liste des 19 principaux outils d'AI red teaming de 2026

Un nouveau tour d'horizon de l'AI red teaming réunit 19 outils — de Microsoft PyRIT et NVIDIA Garak à IBM AIF360 — pour détecter les fuites de données, les attaques de jailbreak et les biais de modèle avant la mise en pr

2 mai 2026·2 min
Meta a présenté Autodata — un système à agents pour créer des données d'entraînement de haute qualité
LLMMarkTechPost

Meta a présenté Autodata — un système à agents pour créer des données d'entraînement de haute qualité

Meta a présenté Autodata — un framework dans lequel des agents LLM collectent, vérifient et améliorent eux-mêmes les données d'entraînement afin que des modèles plus puissants apprennent à partir d'exemples plus complexe

2 mai 2026·3 min
NeuralSet et deep learning : décodage de caractéristiques linguistiques à partir de signaux cérébraux MEG
LLMMarkTechPost

NeuralSet et deep learning : décodage de caractéristiques linguistiques à partir de signaux cérébraux MEG

Une nouvelle analyse de NeuralSet montre comment transformer des signaux MEG bruts en un modèle qui prédit des caractéristiques linguistiques, y compris la longueur du mot, directement à partir de l'activité cérébrale.

2 mai 2026·3 min
Microsoft OpenMementos: comment travailler avec la compression de contexte et les données d'entraînement des modèles
LLMMarkTechPost

Microsoft OpenMementos: comment travailler avec la compression de contexte et les données d'entraînement des modèles

Une analyse pas à pas du dataset Microsoft OpenMementos montre comment streamer des reasoning traces, parser des blocs et des mementos, mesurer la compression de contexte et préparer des données pour le fine-tuning.

1 mai 2026·2 min
Stanford a présenté OpenJarvis — une stack d'agents AI locaux avec mémoire et apprentissage
LLMMarkTechPost

Stanford a présenté OpenJarvis — une stack d'agents AI locaux avec mémoire et apprentissage

Stanford a présenté OpenJarvis — une plateforme pour des agents AI personnels qui fonctionnent directement sur l'appareil, utilisent la mémoire et des outils, et apprennent à partir de données locales.

30 avr. 2026·3 min
Harry Tan a lancé gstack — un système de workflow pour Claude Code avec QA, revue et release
LLMMarkTechPost

Harry Tan a lancé gstack — un système de workflow pour Claude Code avec QA, revue et release

Harry Tan a publié gstack en open source — un ensemble de modes pour Claude Code qui sépare la planification, la revue, le QA et le release en commandes distinctes, et ajoute un navigateur persistant.

30 avr. 2026·3 min
Zhipu AI lance GLM-OCR, un modèle OCR compact de 0,9 milliard de paramètres pour les documents
LLMMarkTechPost

Zhipu AI lance GLM-OCR, un modèle OCR compact de 0,9 milliard de paramètres pour les documents

Zhipu AI et l'université Tsinghua ont présenté GLM-OCR, un modèle OCR multimodal de 0,9 milliard de paramètres capable d'analyser des documents complexes, des tableaux et des formules sans miser sur une échelle massive.

30 avr. 2026·3 min
LangChain a publié Deep Agents pour des agents AI multi-étapes avec mémoire et isolation
LLMMarkTechPost

LangChain a publié Deep Agents pour des agents AI multi-étapes avec mémoire et isolation

LangChain a publié Deep Agents, une bibliothèque pour des agents AI qui ont besoin de planification, de mémoire à long terme, de contexte de fichiers et d'isolation des subagents dans les tâches de longue durée.

30 avr. 2026·3 min
IBM a lancé Granite 4.0 1B Speech — un modèle vocal multilingue compact pour l'edge AI
LLMMarkTechPost

IBM a lancé Granite 4.0 1B Speech — un modèle vocal multilingue compact pour l'edge AI

IBM a présenté Granite 4.0 1B Speech, un modèle léger de reconnaissance et de traduction de la parole conçu pour un déploiement rapide dans des scénarios d'entreprise et d'edge aux ressources limitées.

30 avr. 2026·3 min
Moonshot AI a présenté Attention Residuals — une alternative aux connexions résiduelles dans les transformers
LLMMarkTechPost

Moonshot AI a présenté Attention Residuals — une alternative aux connexions résiduelles dans les transformers

Moonshot AI a proposé Attention Residuals, un remplacement des connexions résiduelles standard dans les transformers, où la couche sélectionne elle-même les signaux utiles via attention sur la profondeur du réseau.

30 avr. 2026·3 min
Mistral a lancé Small 4 — un modèle MoE de 119 milliards de paramètres pour le reasoning, le code et la multimodalité
LLMMarkTechPost

Mistral a lancé Small 4 — un modèle MoE de 119 milliards de paramètres pour le reasoning, le code et la multimodalité

Le nouveau Mistral Small 4 réunit instruct, reasoning, code et traitement d’images dans un seul modèle MoE open-source de 119 milliards de paramètres avec un contexte de 256k.

30 avr. 2026·3 min
Google a lancé WAXAL, un jeu de données de parole ouvert pour les langues africaines
LLMMarkTechPost

Google a lancé WAXAL, un jeu de données de parole ouvert pour les langues africaines

Google a rendu public WAXAL, un vaste corpus de parole pour les langues africaines, qui doit accélérer la reconnaissance et la synthèse de la parole là où les données ouvertes faisaient encore cruellement défaut.

30 avr. 2026·3 min
Nvidia a ouvert le code d’OpenShell, un environnement sécurisé pour les agents autonomes d’AI
LLMMarkTechPost

Nvidia a ouvert le code d’OpenShell, un environnement sécurisé pour les agents autonomes d’AI

Nvidia a publié OpenShell en open source : c’est un environnement avec des sandboxes, des politiques d’accès et un routage privé pour permettre aux agents autonomes d’AI de travailler avec du code et le réseau de manière

30 avr. 2026·3 min