MarkTechPost

L'équipe Qwen a lancé FlashQLA : accélération de l'attention linéaire jusqu'à 3× sur NVIDIA Hopper
QwenLM a lancé FlashQLA — une bibliothèque de kernels CUDA pour Gated Delta Network qui offre un gain de performance jusqu'à 3× sur GPU NVID

OpenAI Privacy Filter : Comment Construire un Pipeline de Production pour la Détection et le Masquage des PII
Le guide OpenAI Privacy Filter détaille un pipeline complet pour détecter et masquer les données personnelles — du chargement du modèle à la

DeepSeek, Google et Meta : 10 techniques de compression de KV-cache pour LLM afin de réduire la mémoire en inférence
KV-cache est devenu un gourmand de mémoire GPU dans les grands LLM, et une nouvelle revue présente 10 approches — de H2O et SnapKV à TurboQu

Poolside a lancé Laguna XS.2 et M.1 — des modèles ouverts pour la programmation multi-agents
Poolside a présenté deux modèles Laguna pour le codage multi-agents : le XS.2 ouvert s'exécute localement, tandis que le plus puissant M.1 e

LlamaIndex ParseBench : comment tester l'analyse de documents via Python et Hugging Face
Un guide pratique montre comment construire un pipeline d'évaluation des analyseurs de documents à l'aide du dataset LlamaIndex ParseBench :

smol-audio de Deep-unlearning : Une collection de notebooks Colab pour l'affinage des modèles audio
Deep-unlearning a lancé smol-audio — une collection de notebooks compatibles avec Colab pour l'affinage de Whisper, Parakeet, Voxtral, Grani

Top 10 des modèles d'IA physique qui contrôlent les robots réels en 2026
En 18 mois, l'écart entre les LLM et la robotique réelle s'est considérablement réduit : les modèles d'IA physique fonctionnent déjà dans le

Hugging Face et Gemma 3 1B: Construire un Pipeline de Génération Prêt pour la Production dans Colab
Une analyse de la manière d'exécuter Gemma 3 1B Instruct dans Colab via Hugging Face Transformers: avec une autorisation sécurisée, des chat

Z.ai lance GLM-5V-Turbo — modèle multimodal natif pour la programmation visuelle
Le laboratoire chinois Z.ai a lancé GLM-5V-Turbo — un modèle qui reconnaît les diagrammes architecturaux et les captures d'écran et génère i

Google Gemma 4, NVIDIA et OpenClaw : Agents IA locaux sans facturation par token
Google et NVIDIA promeuvent le déploiement local de Gemma 4 sur RTX, Jetson et DGX Spark pour que les agents IA toujours actifs comme OpenCl

Talkie-1930: Les chercheurs ont lancé un modèle 13B sans connaissance d'Internet et de la Seconde Guerre mondiale
Talkie-1930 est un modèle 13B ouvert, entraîné uniquement sur des textes en anglais jusqu'en 1931, pour étudier la pensée historique, les fu

MarkTechPost montre comment construire un agent VLA léger avec un modèle de monde latent et MPC
Dans un nouveau tutoriel, MarkTechPost explique comment construire un agent incarné simplifié : il fonctionne sur des images RGB, apprend un

Arcee AI a Lancé Trinity Large Thinking — Modèle de Raisonnement Ouvert pour Agents IA
Arcee AI a libéré les poids de Trinity Large Thinking sous licence Apache 2.0 et mise sur les scénarios d'agents longs, le raisonnement mult

NVIDIA a présenté un pipeline complet d'optimisation de modèles avec FastNAS pruning et fine-tuning
NVIDIA a publié un guide pratique pour Model Optimizer : dans un seul notebook Colab sont démontrés l'entraînement de ResNet20, FastNAS prun

TII lance Falcon Perception — modèle 0,6B pour la segmentation et la recherche d'objets par texte
TII a présenté Falcon Perception — un modèle vision-langage compact avec 0,6 milliard de paramètres qui recherche et segmente des objets à p

Google DeepMind Permet aux LLM de Réécrire les Algorithmes de la Théorie des Jeux et de Surpasser les Experts
Google DeepMind a démontré qu'AlphaEvolve peut réécrire le code des algorithmes pour les jeux avec information incomplète et trouver des sol

Z.AI a montré comment construire des systèmes agentic production-ready sur GLM-5 avec tool calling
Z.AI a lancé un tutoriel détaillé sur GLM-5 : de la configuration du SDK et de l'API compatible avec OpenAI au streaming, tool calling, sort

Netflix Lance Void — Modèle pour Supprimer les Objets des Vidéos en Tenant Compte de la Physique de la Scène
L'équipe de Netflix et INSAIT a publié en open source Void — un système qui supprime les objets des vidéos tout en recalculant simultanément

Comment l'Intelligence Artificielle Aide les Marques de Mode à Concevoir la Mode du Futur
Les algorithmes aident déjà les marques de mode à créer des collections plus rapidement, à prévoir les tendances, à réduire la surproduction

Comment Construire un Pipeline Netflix Void pour la Suppression d'Objets dans les Vidéos en Utilisant CogVideoX
Un examen détaillé montre comment déployer le modèle Netflix Void, télécharger les points de contrôle nécessaires, préparer les données d'en

Gladstone Institutes présente MaxToki — un modèle d'IA qui prédit le vieillissement cellulaire
Le modèle MaxToki de Gladstone Institutes apprend à voir non pas un 'instantané' de la cellule, mais sa trajectoire au fil du temps, évalue

TinyFish Lance une Plateforme Web Unifiée pour Agents IA avec Search, Fetch, Browser et Agent
TinyFish a combiné la recherche, le rendu de pages, les sessions de navigateur et les flux de travail web autonomes dans une plateforme uniq

Google a ajouté Skills dans Chrome et transformé les prompts d'IA en scénarios à un clic
Google a lancé la fonctionnalité Skills dans Chrome : les utilisateurs de Gemini pourront enregistrer les prompts fréquemment utilisés comme

Google DeepMind Présente Gemini Robotics-ER 1.6 pour l'Autonomie et la Lecture d'Instruments par les Robots
Google DeepMind a mis à jour Gemini Robotics-ER à la version 1.6 : un modèle pour robots qui comprend mieux l'espace, gère plusieurs flux vi

MarkTechPost a détaillé le cycle complet d'entraînement des grands modèles de langage : des données au déploiement
MarkTechPost a publié une analyse détaillée de la façon dont les LLM sont construits aujourd'hui : du préentraînement sur de grands corpus à

Google a présenté Gemini 3.1 Flash TTS — modèle de parole avec contrôle, dialogues et 70+ langues
Google a lancé Gemini 3.1 Flash TTS en aperçu : le modèle synthétise du texte en 70+ langues, supporte les dialogues avec deux voix et perme

Mem0 et OpenAI : comment construire une couche universelle de mémoire à long terme pour les agents IA
Un nouveau tutoriel décortique la combinaison de Mem0, des modèles OpenAI et ChromaDB : elle extrait les faits des conversations ordinaires,

SmolAgents : Comment Construire un Système d'IA Multi-Agent avec Code et Orchestration Dynamique
Une analyse de l'implémentation de SmolAgents montre comment les agents d'IA légers exécutent du code, invoquent des outils, gèrent la mémoi

NetKet et JAX : comment construire un modèle Transformer pour les systèmes de spins frustrés
Le guide montre comment construire un pipeline de VMC de recherche en utilisant NetKet, JAX et l'architecture Transformer pour modéliser une

OpenAI a présenté GPT-Rosalind — un modèle d'IA pour la biologie, la génomique et le développement de médicaments
OpenAI a lancé GPT-Rosalind — un modèle spécialisé pour la biologie et la pharmacie qui aide à accélérer le développement de médicaments, l'