Éditeur · vérifié par la rédaction

MarkTechPost

Source d'actualités IA. Les articles sont sélectionnés et adaptés par la rédaction de Hamidun News.

290 articles dans Hamidun·Dernier: 17 juillet· Actif·marktechpost.com ↗

Dernières publications

Meta a ouvert le code d’Astryx — un design system React avec prise en charge des agents AI et de MCP

Meta a lancé Astryx — un design system open-source en React et StyleX avec un serveur MCP et une CLI, dans lequel ingénieurs et agents AI travaillent via une API unique avec les mêmes composants. *Meta est reconnue comme

28 juin 2026·2 min

LLMMarkTechPost

Liquid AI a lancé LFM2.5-230M : 213 tokens/s sur Galaxy S25 et prise en charge de llama.cpp

Liquid AI a lancé LFM2.5-230M, un modèle ouvert de 230 millions de paramètres qui fonctionne hors ligne sur smartphone et Raspberry Pi, dépassant des concurrents quatre fois plus grands en suivi d'instructions.

28 juin 2026·2 min

LLMMarkTechPost

Datalab lance lift, un modèle de 9 milliards de paramètres à poids ouverts pour extraire du JSON depuis des PDF

Datalab a ouvert le code de lift, un modèle visuel de 9 milliards de paramètres qui convertit PDF et images en JSON structuré selon un schéma donné, atteignant 90,2 % de précision par champ sur un benchmark de 225 docume

28 juin 2026·3 min

LLMMarkTechPost

Z.ai lance GLM-5.2 : un vrai million de tokens et deux niveaux de réflexion profonde

Z.ai a lancé GLM-5.2 avec une véritable fenêtre de contexte de 1 million de tokens, modes High et Max, et support pour Claude Code, Cline et OpenClaw via une API compatible avec Anthropic.

15 juin 2026·2 min

LLMMarkTechPost

FineWeb sans télécharger des téraoctets : streaming, filtrage et tokenization de corpus web pour LLM

Un guide pratique de FineWeb de Hugging Face : comment travailler avec un corpus web de plusieurs téraoctets pour l'entraînement des LLM via streaming, filtrage, déduplication et tokenization — sans télécharger complètem

15 juin 2026·3 min

LLMMarkTechPost

Zyphra a lancé Zamba2-VL : modèles visuels avec une réponse 10 fois plus rapide

Zyphra a lancé Zamba2-VL — VLMs ouverts avec 1,2B, 2,7B et 7B paramètres avec une architecture hybride Mamba2 + Transformer qui réduit le temps jusqu'au premier token d'environ 10 fois.

15 juin 2026·2 min

LLMMarkTechPost

Moonshot AI lance Kimi Work — agent de bureau avec essaim de 300 sous-agents

Kimi Work de Moonshot AI s'exécute localement sur macOS et Windows, contrôle le navigateur via WebBridge et coordonne un essaim de jusqu'à 300 sous-agents parallèles.

15 juin 2026·2 min

LLMMarkTechPost

Claude Code 2026 : Analyse Complète de 25 Fonctionnalités de l'Outil Agentif avec Exemples

MarkTechPost a publié un guide sur Claude Code 2026 avec analyse de 25 fonctionnalités — de CLAUDE.md et skills jusqu'à MCP, hooks et Auto Mode — avec des exemples de code et une démo.

15 juin 2026·2 min

LLMMarkTechPost

Google lance Gemini-SQL2 : Gemini 3.1 Pro obtient 80% au benchmark BIRD

Google Research a présenté Gemini-SQL2 basé sur Gemini 3.1 Pro — le modèle a atteint 80,04% de précision sur le benchmark BIRD pour la conversion texte-to-SQL.

15 juin 2026·3 min

LLMMarkTechPost

Comment Construire un Espace de Travail d'Agents sur QwenPaw avec des Compétences Personnalisées et une API de Streaming

Tutoriel étape par étape pour le déploiement de QwenPaw — un framework pour créer des agents d'IA avec support de plusieurs fournisseurs de modèles, des compétences personnalisées et une API de streaming dans Google Cola

15 juin 2026·3 min

LLMMarkTechPost

Moonshot AI lance Kimi K2.7-Code : amélioration de 21,8% sur Code Bench v2 par rapport à K2.6

Moonshot AI a publié le code source de Kimi K2.7-Code — un modèle de codage agent avec contexte de 256K et consommation de tokens de raisonnement 30% inférieure par rapport à K2.6.

15 juin 2026·3 min

LLMMarkTechPost

Comparaison des modèles TTS 2026 : des solutions commerciales aux modèles open-source

En 2026, le choix d'un modèle TTS dépend de trois facteurs : la qualité audio, la latence de traitement et le coût. Les solutions commerciales gagnent en naturel, les modèles open-source en contrôle et en prix.

31 mai 2026·3 min

LLMMarkTechPost

StepFun présente Step 3.7 Flash — un modèle Vision-Language de 198 milliards de paramètres

StepFun a lancé Step 3.7 Flash, un nouveau modèle multimodal doté de 198 milliards de paramètres, d'une vision intégrée, d'une fenêtre de contexte de 256K tokens et d'un mode Advisor pour les agents de code.

31 mai 2026·3 min

LLMMarkTechPost

NVIDIA X-Token : une distillation qui dépasse GOLD de 3,82 points

NVIDIA a lancé X-Token, une méthode de distillation des connaissances pour les petits modèles (Llama-3.2-1B) qui dépasse GOLD de 3,82 points et améliore la précision en mathématiques de 2,56 à 15,54 %.

31 mai 2026·2 min

LLMMarkTechPost

AgentTrove : comment utiliser le jeu de données de 1,7 million de traces d'agents en Python

AgentTrove est le plus grand jeu de données ouvert de traces d'interaction entre agents : 1,7 million d'exemples au format ShareGPT. Un tutoriel Python montre comment streamer les données, normaliser les actions des agen

31 mai 2026·2 min

LLMMarkTechPost

Nous Research a lancé Tool Search pour Hermes Agent : la précision a augmenté de 49 à 74 % sur Opus 4

Nous Research a résolu le problème du gonflement du contexte dans MCP en ajoutant une recherche intelligente d’outils. Le système ne sélectionne que les schémas pertinents et améliore la précision de plusieurs dizaines d

31 mai 2026·2 min

LLMMarkTechPost

Genesis AI lance Genesis World 1.0 — une plateforme pour évaluer les robots 400 fois plus vite

Genesis AI a lancé Genesis World 1.0, une plateforme de simulation de robots qui réduit le temps d’évaluation de 200 heures à 30 minutes et reproduit le comportement réel avec 90 % de fidélité.

31 mai 2026·2 min

LLMMarkTechPost

NVIDIA a lancé Polar — un framework pour l'entraînement d'agents de code

NVIDIA a créé Polar — un framework pour l'entraînement d'agents linguistiques via apprentissage par renforcement, qui a amélioré les performances sur SWE-Bench de 22,6 points dans l'environnement Codex.

29 mai 2026·2 min

LLMMarkTechPost

UC Berkeley a créé mKernel : une bibliothèque unifiée pour la synchronisation des GPU en clusters

UC Berkeley a lancé mKernel — une nouvelle bibliothèque CUDA pour synchroniser des milliers de GPUs dans les data centers, combinant la communication locale et distante dans un seul kernel persistant.

29 mai 2026·2 min

LLMMarkTechPost

Stability AI lance Stable Audio 3 pour la génération rapide de musique

Stability AI a présenté Stable Audio 3 — des modèles de génération de musique et d'effets sonores qui fonctionnent sur MacBook et GPU grand public avec 8GB VRAM.

29 mai 2026·2 min

LLMMarkTechPost

ZeroEntropy présente Zerank-2 — un réordonnateur léger pour une recherche précise

ZeroEntropy a lancé Zerank-2, un cross-encodeur compact basé sur Qwen3, qui améliore considérablement la qualité de la recherche dans les systèmes RAG à deux étapes.

29 mai 2026·2 min

LLMMarkTechPost

Sakana AI a présenté DiffusionBlocks : une méthode d'entraînement des réseaux de neurones par blocs

Sakana AI a présenté DiffusionBlocks — une nouvelle méthode qui permet d'entraîner les couches de réseaux résiduels indépendamment les unes des autres, en interprétant les mises à jour comme une diffusion inverse.

29 mai 2026·3 min

LLMMarkTechPost

Recherche vectorielle dans PostgreSQL: guide complet de pgvector pour les applications IA

PostgreSQL est devenu un concurrent sérieux des bases de données vectorielles spécialisées grâce à l'extension pgvector.

29 mai 2026·3 min

LLMMarkTechPost

Perplexity AI Publie un Tokenizeur 5x Plus Rapide que le Standard Hugging Face

Perplexity AI a publié un tokenizeur Unigram réécrit qui accélère le traitement du texte 5x et réduit la charge CPU de 5-6x en environnement de production.

29 mai 2026·3 min

LLMMarkTechPost

Des chercheurs créent MEMO — un framework pour étendre la mémoire des LLM sans réentraînement

Des chercheurs ont proposé MEMO — un framework qui permet aux LLM d'apprendre de nouvelles données sans réentraîner le modèle principal, en utilisant un module mémoire séparé.

29 mai 2026·3 min

LLMMarkTechPost

EAGLE 3.1: comment corriger l'instabilité du décodage spéculatif dans les LLM

La version conjointe d'EAGLE team, vLLM et TorchSpec corrige un problème critique du décodage spéculatif — la dérive d'attention qui ralentissait l'inférence des grands modèles de langage en production.

29 mai 2026·2 min

LLMMarkTechPost

Anthropic a Lancé Claude Opus 4.8 avec des Workflows Dynamiques et un Fast Mode Moins Cher

Anthropic a présenté Claude Opus 4.8 avec des workflows dynamiques et un fast mode plus abordable. La mise à jour est disponible en aperçu de recherche de Claude Code.

29 mai 2026·3 min

LLMMarkTechPost

Liquid AI a lancé LFM2.5-8B : un modèle MoE compact avec un contexte de 128K

Liquid AI a présenté le nouveau modèle LFM2.5-8B-A1B — un modèle MoE économe qui n'active que 1,5B paramètres sur 8,3B. Fonctionne sur un PC grand public avec un contexte de 128K.

29 mai 2026·2 min

LLMMarkTechPost

Hexo Labs a publié SIA — un agent qui se met à jour pendant son fonctionnement

Hexo Labs a libéré le code source de SIA — un système qui s'améliore lui-même en mettant à jour à la fois les instructions de l'agent et les poids de son réseau de neurones.

29 mai 2026·1 min

LLMMarkTechPost

Microsoft Research lance Webwright — un agent navigateur qui résout les tâches web à 60%

Microsoft Research a présenté Webwright — un agent navigateur qui exécute les tâches web complexes mieux que les grands modèles de langage : 60% de réussite sur le benchmark Odysseys contre 33,5% pour le GPT-5.4 de base.

25 mai 2026·2 min