Éditeur · vérifié par la rédaction

MarkTechPost

Source d'actualités IA. Les articles sont sélectionnés et adaptés par la rédaction de Hamidun News.

290 articles dans Hamidun·Dernier: 17 juillet· Actif·marktechpost.com ↗

Dernières publications

StepFun lance StepAudio 2.5 Realtime, un modèle vocal en temps réel avec support du roleplay

Le laboratoire chinois StepFun a présenté StepAudio 2.5 Realtime, un modèle vocal en temps réel qui surpasse les concurrents en naturalité vocale et peut adapter la voix selon le scénario de l'utilisateur.

25 mai 2026·2 min

LLMMarkTechPost

Langfuse pour les Ingénieurs LLM : Pipeline Complet de Traçage et Expériences

Langfuse est un outil pour le débogage et l'optimisation des applications LLM. Apprenez à configurer un pipeline complet de surveillance, de gestion des prompts et d'expériences sans modèles payants.

25 mai 2026·2 min

LLMMarkTechPost

WorkOS a présenté auth.md — un protocole ouvert d'enregistrement des agents IA

WorkOS a lancé auth.md — une norme ouverte qui permet aux agents IA de s'enregistrer automatiquement dans des applications via un fichier Markdown sans intervention humaine.

25 mai 2026·3 min

LLMMarkTechPost

ByteDance Dévoile Lance : Un Modèle Unique pour la Compréhension, la Génération et l'Édition de Vidéo

ByteDance a lancé Lance — un modèle ouvert qui fonctionne avec des images et des vidéos dans un seul framework : comprend, génère et édite du contenu en utilisant seulement 3B paramètres actifs.

25 mai 2026·2 min

LLMMarkTechPost

Cohere lance Command A+ : 218 milliards de paramètres pour agents sur deux GPUs

Cohere a dévoilé le modèle ouvert Command A+ avec 218 milliards de paramètres et des capacités multimodales, fonctionnant sur deux GPUs H100 et supportant 48 langues.

25 mai 2026·2 min

LLMMarkTechPost

Perplexity Ouvre le Scanner Bumblebee pour Protéger les Systèmes de Développement

Perplexity a publié le code source de Bumblebee, un outil permettant de scanner les vulnérabilités dans les dépendances des systèmes de développement sans exécuter aucun code.

25 mai 2026·2 min

LLMMarkTechPost

Alibaba a présenté Qwen3.7-Max : un agent avec un contexte d'un million de tokens

Alibaba a présenté Qwen3.7-Max, le modèle d'agent le plus avancé de Qwen avec un contexte de 1M tokens et un mode de raisonnement pour les tâches complexes multi-étapes.

25 mai 2026·3 min

LLMMarkTechPost

CopilotKit redéfinit l'architecture des agents IA en 2026

CopilotKit a lancé une stack pour les développeurs d'IA agentic : le protocole AG-UI, la plateforme de test AIMock et le serveur Pathfinder — une solution complète pour la production.

25 mai 2026·3 min

LLMMarkTechPost

OpenMythos : créer des transformateurs avancés avec MLA et GQA dans Colab

OpenMythos permet de construire des transformateurs récurrents dans Google Colab en comparant les architectures MLA et GQA, avec vérification de stabilité via le rayon spectral.

25 mai 2026·2 min

LLMMarkTechPost

Nous Research présente CNA : gérer le comportement des LLM sans réentraînement

Nous Research a présenté la méthode Contrastive Neuron Attribution (CNA), qui permet de gérer le comportement des grands modèles de langage en identifiant et désactivant des circuits de neurones sans réentraînement ni mo

25 mai 2026·3 min

LLMMarkTechPost

Huit meilleures plateformes d'authentification pour les agents IA et MCP en 2026

MCP a atteint 97 millions de téléchargements de SDK par mois. Les agents d'IA migrent massivement des expériences vers les environnements de production, et le choix de la bonne plateforme…

25 mai 2026·2 min

LLMMarkTechPost

SuperClaude Framework aide à structurer les workflows pour Claude API

SuperClaude Framework fournit aux développeurs des composants intégrés pour créer des workflows d'IA avancés : commandes, agents, modes d'exécution et mémoire de session — le tout dans un seul système.

25 mai 2026·2 min

LLMMarkTechPost

Tencent a lancé un système de mémoire local pour les agents IA TencentDB

Tencent a ouvert le code source de TencentDB Agent Memory — un système de mémoire local pour les agents IA qui réduit la consommation de tokens de 61% et améliore la précision de 28%.

25 mai 2026·3 min

LLMMarkTechPost

NVIDIA Présente Gated DeltaNet-2: Attention Linéaire avec Portes Mémoire Séparées

NVIDIA a créé un nouveau mécanisme d'attention linéaire, Gated DeltaNet-2, qui améliore la gestion de la mémoire dans les grands modèles de langage grâce à des portes d'effacement et d'écriture séparées au lieu d'une seu

25 mai 2026·3 min

LLMMarkTechPost

Google présente Gemini 3.5 Flash : un modèle rapide et économique pour le codage et les agents IA

À l'I/O 2026, Google a présenté Gemini 3.5 Flash — un modèle 75 % moins cher que la version phare, 4 fois plus rapide et qui excelle dans le codage et l'automatisation.

21 mai 2026·3 min

LLMMarkTechPost

Alibaba lance un traducteur avec une latence de 2.8 secondes dans 60 langues

Alibaba a présenté un modèle de traduction en temps réel de la vidéo et de la parole simultanément dans 60 langues, avec une latence minimale et la préservation de la voix du locuteur.

21 mai 2026·2 min

LLMMarkTechPost

NVIDIA présente Nemotron-Labs-Diffusion : un modèle à triple décodage

NVIDIA a publié le modèle de langage Nemotron-Labs-Diffusion, qui combine trois modes de décodage et traite les tokens 6 fois plus vite que Qwen3-8B.

21 mai 2026·2 min

LLMMarkTechPost

Génération de graphes de connaissances à partir de texte : guide pratique avec kg-gen et NetworkX

Tutoriel sur l'extraction automatique d'entités et de relations à partir de texte avec kg-gen, la création de graphes de connaissances interactifs et leur analyse avec NetworkX.

21 mai 2026·3 min

LLMMarkTechPost

Turbovec : index vectoriel en Rust avec l’algorithme TurboQuant de Google Research

Turbovec utilise l’algorithme TurboQuant de Google pour compresser les vecteurs par 16 sans préentraînement, ce qui simplifie le déploiement des applications RAG.

21 mai 2026·2 min

LLMMarkTechPost

Les meilleures plateformes d'AI agentique en 2026 : classement de Salesforce, Microsoft et d'autres

Les entreprises passent des pilotes à la production. MarkTechPost a établi un classement des 10 meilleures plateformes d'AI agentique : Salesforce Agentforce, Microsoft Copilot Studio, ServiceNow et d'autres. Prix vérifi

19 mai 2026·3 min

LLMMarkTechPost

NVIDIA a développé une méthode pour entraîner des réseaux neuronaux en précision 4-bit

NVIDIA a présenté NVFP4, une méthodologie pour entraîner de grands modèles en précision 4-bit au lieu de la 8-bit standard, réduisant de moitié la consommation de mémoire sans perte de qualité.

19 mai 2026·3 min

LLMMarkTechPost

OpenAI présente le protocole MRC pour des réseaux de superordinateurs avec des millions de GPU

OpenAI a créé un nouveau protocole réseau ouvert, MRC, pour les grands clusters d'AI. Il répartit les données sur des centaines de chemins et se remet des pannes en quelques microsecondes, permettant de construire des su

17 mai 2026·3 min

LLMMarkTechPost

Meta AI a présenté NeuralBench — un framework pour tester des modèles d’activité cérébrale

Meta a lancé NeuralBench, un framework ouvert pour l’évaluation standardisée de modèles d’AI basés sur l’EEG, réunissant 36 tâches, 94 jeux de données et 13,603 heures d’enregistrements cérébraux dans une interface uniqu

17 mai 2026·2 min

LLMMarkTechPost

Comment compresser un modèle de langage par 3 : guide de FP8, GPTQ et SmoothQuant

Les développeurs ont reçu un guide pas à pas pour compresser de grands modèles de langage avec llmcompressor, comparant l’efficacité des méthodes de quantification FP8, GPTQ et SmoothQuant afin de réduire la charge matér

17 mai 2026·3 min

LLMMarkTechPost

OpenAI a lancé trois modèles audio : traduction, transcription et raisonnement en temps réel

OpenAI a enrichi la Realtime API de trois nouveaux modèles audio pour le traitement de la voix : des agents de raisonnement, la traduction multilingue et la transcription en continu.

17 mai 2026·2 min

LLMMarkTechPost

Anthropic a créé un outil pour traduire les pensées de Claude en langage humain

Anthropic a développé Natural Language Autoencoders, une technologie qui traduit les activations internes de Claude en explications textuelles et révèle le fonctionnement du réseau neuronal.

17 mai 2026·2 min

LLMMarkTechPost

NVIDIA a empaqueté 3 modèles dans un seul fichier et rendu l'entraînement 360× plus efficace

NVIDIA a présenté Star Elastic, une méthode qui regroupe trois modèles de tailles différentes dans un seul checkpoint et permet un entraînement 360× plus efficace.

17 mai 2026·3 min

LLMMarkTechPost

NVIDIA a lancé cuda-oxide : un compilateur de code Rust pour GPU

NVIDIA a présenté cuda-oxide, un outil permettant de compiler des fonctions Rust directement en code PTX pour GPU. Cela simplifiera le développement d'applications CUDA en Rust et rendra le calcul parallèle plus accessib

17 mai 2026·1 min

LLMMarkTechPost

NadirClaw : réduire le coût des requêtes LLM grâce à un routage intelligent des prompts

NadirClaw est un outil de routage intelligent des prompts qui classe les requêtes comme simples ou complexes et les envoie vers le modèle approprié afin de réduire les coûts.

17 mai 2026·2 min

LLMMarkTechPost

Hermes Agent de Nous Research a pris la tête de la consommation de tokens sur OpenRouter

L'agent AI open-source Hermes Agent de Nous Research a dépassé la plateforme à code source fermé OpenClaw et a pris la première place sur OpenRouter, en générant 224 milliards de tokens par jour. Cela s'est produit en se

17 mai 2026·3 min