Éditeur · vérifié par la rédaction

MarkTechPost

Source d'actualités IA. Les articles sont sélectionnés et adaptés par la rédaction de Hamidun News.

290 articles dans Hamidun·Dernier: 17 juillet· Actif·marktechpost.com ↗

Dernières publications

Sakana AI lance le traducteur Sakana Translate pour le japonais, l'anglais et le chinois

Sakana AI a ajouté le traducteur Sakana Translate à Sakana Chat, basé sur les modèles Namazu — avec trois modes : traduction directe, révision et dialogue avec documents.

6 juil. 2026·2 min

LLMMarkTechPost

Ajustement fin de Gemma-3 en mathématiques à l'aide de GRPO et d'adaptateurs LoRA

Un flux de travail GRPO étape par étape pour affiner Gemma-3 sur l'ensemble de données GSM8K—de la configuration de l'environnement et des adaptateurs LoRA aux fonctions de récompense et à l'exportation du modèle final.

6 juil. 2026·3 min

LLMMarkTechPost

Page Agent d'Alibaba Gère les Interfaces Web via DOM Sans Captures d'Écran et Modèles Multimodaux

Alibaba a présenté Page Agent — un agent JavaScript côté client qui comprend les commandes textuelles et gère les pages web via DOM sans captures d'écran ni code serveur.

6 juil. 2026·2 min

LLMMarkTechPost

Anthropic lance Claude Science Beta : Environnement multi-agent pour la génomique et la protéomique

Le 30 juin 2026, Anthropic a ouvert l'accès bêta à Claude Science — une plateforme multi-agent pour les pipelines reproductibles en génomique, protéomique et chimoinformatique.

5 juil. 2026·2 min

LLMMarkTechPost

NVIDIA présente ASPIRE — un framework de robotique auto-apprenant avec 31% de succès zero-shot sur les tâches complexes

NVIDIA a lancé ASPIRE — un framework pour robots qui écrit et améliore les programmes de contrôle, accumule les solutions vérifiées dans une bibliothèque de compétences et les transfère à de nouvelles tâches sans réappre

5 juil. 2026·2 min

LLMMarkTechPost

NVIDIA HORIZON : Agent Autonome Ferme 100% des Benchmarks RTL en Conception de Puces

NVIDIA a présenté HORIZON — un agent qui écrit et vérifie indépendamment le code RTL pour la conception de puces, atteignant 100% de conformité sur les benchmarks standards.

5 juil. 2026·2 min

LLMMarkTechPost

Ancien leader technique de Qwen : pourquoi le raisonnement hybride a échoué et ce qui suit

Zunyuan Lin, ancien leader de développement de Qwen chez Alibaba, a expliqué où le raisonnement dynamique de Qwen3 a échoué—et pourquoi l'IA agentive nécessite une approche d'entraînement fondamentalement différente.

5 juil. 2026·2 min

LLMMarkTechPost

LlamaIndex a lancé legal-kb : recherche de documents avec agents via quatre outils sur Index v2

LlamaIndex a publié l'application de référence legal-kb, donnant aux agents un accès de type fichier à une base de connaissances via retrieve, find, read et grep sur le moteur Index v2.

5 juil. 2026·2 min

LLMMarkTechPost

NVIDIA a Lancé Nemotron-Labs-TwoTower — Modèle de Langage Diffusion aux Poids Ouverts

NVIDIA a ouvert les poids du modèle de langage Nemotron-Labs-TwoTower, qui combine un backbone AR gelé avec une tête de diffusion pour accélérer la génération de texte.

4 juil. 2026·2 min

LLMMarkTechPost

Interfaze a lancé un modèle ASR open source par diffusion pour la reconnaissance de six langues

Interfaze a publié diffusion-gemma-asr-small — le premier adaptateur ASR open source basé sur DiffusionGemma de Google : 42 millions de paramètres, six langues et un coût d'inférence lié au nombre d'étapes de débruitage.

3 juil. 2026·2 min

LLMMarkTechPost

WebBrain : l’agent AI open source pour navigateur fonctionne sans cloud et sans abonnement

WebBrain est un agent gratuit sous licence MIT pour Chrome et Firefox qui lit les pages et automatise des tâches, en fonctionnant localement via llama.cpp ou Ollama.

3 juil. 2026·2 min

LLMMarkTechPost

Anthropic Lance Claude Fable 5 et Mythos 5 : Un Modèle, Deux Niveaux d'Accès

Anthropic a ouvert Fable 5 au public avec des classificateurs de sécurité complets, tandis que Mythos 5—avec les restrictions cybernétiques supprimées—est distribué uniquement par le programme fermé Project Glasswing.

30 juin 2026·3 min

LLMMarkTechPost

Comment accélérer l'entraînement des transformers avec NVIDIA Apex : FusedAdam, FusedLayerNorm et torch.amp

Guide pas à pas pour compiler NVIDIA Apex depuis les sources et utiliser FusedAdam, FusedLayerNorm et la précision mixte — jusqu'à 2,5× de gain dans l'entraînement des transformers.

30 juin 2026·2 min

LLMMarkTechPost

JetBrains a lancé Mellum2 — un modèle MoE ouvert de 12B pour les tâches rapides dans les pipelines AI

JetBrains a publié Mellum2 sous Apache 2.0 — un modèle MoE compact de 12 milliards de paramètres, entraîné sur 10,6 billions de tokens pour s’intégrer dans des pipelines AI multi-modèles.

30 juin 2026·2 min

LLMMarkTechPost

Alibaba a lancé Qwen3.7-Plus : agent multimodal avec analyse vidéo et codage autonome

Alibaba a lancé sur la plateforme Bailian l’agent multimodal Qwen3.7-Plus — le modèle peut traiter des images et des vidéos, appeler des outils et itérer sur le code de façon autonome, sans intervention de l’opérateur.

30 juin 2026·2 min

LLMMarkTechPost

PyGraphistry : analyse de graphes pour la détection des menaces dans les données d’entreprise

Des chercheurs ont publié un workflow PyGraphistry sur Colab qui transforme des données d’accès d’entreprise en un graphe interactif avec des anomalies basées sur le ML et trois modes de visualisation pour l’investigatio

30 juin 2026·2 min

LLMMarkTechPost

Google DeepMind lance DiffusionGemma — un modèle MoE ouvert de 26B avec une génération 4 fois plus rapide

Google DeepMind a lancé DiffusionGemma, un modèle ouvert expérimental de 26B paramètres qui utilise la diffusion de texte plutôt que l'autorégression — la génération est jusqu'à 4 fois plus rapide sur GPU.

30 juin 2026·2 min

LLMMarkTechPost

Microsoft SkillOpt : optimisation automatique des prompts au lieu du tâtonnement manuel

Microsoft SkillOpt optimise les prompts AI via une boucle automatique en six étapes — réflexion, sélection, validation gating — et montre un gain mesurable de précision dès les premières itérations.

30 juin 2026·2 min

LLMMarkTechPost

North Mini Code de Cohere : modèle MoE open-weight de 30B pour le codage agentique

Cohere a lancé son premier modèle open-weight pour les développeurs — North Mini Code, avec une architecture MoE, 30B de paramètres, un contexte de 256K et une exécution sur un seul GPU H100.

30 juin 2026·2 min

LLMMarkTechPost

MiniMax a lancé MSA : l’attention clairsemée accélère de 28x le traitement d’un contexte de 1 million de tokens

MiniMax a présenté MSA, un mécanisme d’attention clairsemée à deux branches, entraîné sur un modèle MoE de 109 milliards de paramètres, 28x plus rapide que le GQA standard avec 1 million de tokens de contexte.

30 juin 2026·2 min

LLMMarkTechPost

Docling Parse : pipeline de parsing de PDF avec une précision au caractère et à la coordonnée près

Ce tutoriel montre comment utiliser Docling Parse pour l’analyse structurelle de PDF : coordonnées de chaque mot, surimpressions visuelles et export en JSON et CSV pour les systèmes RAG.

30 juin 2026·3 min

LLMMarkTechPost

TimeCopilot : comment construire un pipeline de prévision avec des modèles fondamentaux et une détection d'anomalies

TimeCopilot permet de construire un cycle complet de prévision — des modèles statistiques aux modèles fondamentaux — avec détection automatique des anomalies et un agent LLM qui explique les prédictions.

29 juin 2026·2 min

LLMMarkTechPost

Cisco ouvre le code de FAPO : optimisation automatique des pipelines LLM avec diagnostic à chaque étape

Cisco Foundation AI a publié en open source FAPO, un outil basé sur Claude Code qui trouve lui-même le maillon faible dans une chaîne de prompts et optimise le pipeline jusqu'à la précision cible.

29 juin 2026·3 min

LLMMarkTechPost

MoonMath AI publie un noyau HIP open source pour AMD MI300X qui surpasse l'AITER v3 officiel

La startup MoonMath AI a ouvert le code source d'un noyau d'attention pour AMD MI300X qui surpasse la bibliothèque officielle d'AMD sur toutes les formes de tenseurs et tous les modes d'arrondi.

29 juin 2026·2 min

LLMMarkTechPost

xAI lance /goal dans Grok Build : un agent autonome planifie et vérifie des tâches à plusieurs étapes

Grok Build dispose désormais du mode /goal : l'agent reçoit un objectif unique, élabore lui-même son plan d'exécution, avance dans une liste de contrôle et vérifie le résultat à chaque étape jusqu'à l'achèvement complet.

29 juin 2026·2 min

LLMMarkTechPost

Comment créer un agent AI dans Google Colab sans frameworks : tutoriel avec mémoire et MCP

Tutoriel pas à pas pour créer un agent AI léger dans Google Colab — avec enregistrement des outils, mémoire de session, skills et serveur MCP, sans frameworks externes.

28 juin 2026·2 min

LLMMarkTechPost

OpenAI présente GPT-5.6 avec trois niveaux — Sol, Terra et Luna — et des modes de raisonnement

OpenAI a annoncé la famille GPT-5.6 avec trois modèles — Sol, Terra et Luna — et de nouveaux modes de raisonnement, max et ultra. L’accès est pour l’instant limité à des développeurs sélectionnés.

28 juin 2026·2 min

LLMMarkTechPost

Perplexity lance Computer for Counsel — un agent d’AI pour les équipes juridiques

Perplexity a lancé un agent d’AI spécialisé pour les juristes : acheminement via plus de 20 modèles, intégration avec Microsoft 365 et Midpage, et toutes les réponses accompagnées de liens vérifiables vers les sources.

28 juin 2026·2 min

LLMMarkTechPost

NVIDIA Open-SWE-Traces : préparation des données pour le fine-tuning d’agents de codage

Le tutoriel montre comment travailler avec le dataset NVIDIA Open-SWE-Traces : parser les trajectoires d’agents, analyser les patchs de code et constituer un jeu SFT pour entraîner des agents de AI.

28 juin 2026·2 min

LLMMarkTechPost

DeepSeek a lancé DSpark — un framework qui accélère la génération avec DeepSeek-V4 de 57 à 85 %

DeepSeek a ouvert le code source de DSpark — un framework de décodage spéculatif pour DeepSeek-V4 qui accélère la génération de 57 à 85 % sans perte de qualité.

28 juin 2026·2 min