Источник

MarkTechPost

139
всего статей
78
за неделю
30 апреля
последнее обновление
RSSОригинал →
LLM
LLM·MarkTechPost

L'équipe Qwen a lancé FlashQLA : accélération de l'attention linéaire jusqu'à 3× sur NVIDIA Hopper

QwenLM a lancé FlashQLA — une bibliothèque de kernels CUDA pour Gated Delta Network qui offre un gain de performance jusqu'à 3× sur GPU NVID

2026-04-30·2 мин
LLM
LLM·MarkTechPost

OpenAI Privacy Filter : Comment Construire un Pipeline de Production pour la Détection et le Masquage des PII

Le guide OpenAI Privacy Filter détaille un pipeline complet pour détecter et masquer les données personnelles — du chargement du modèle à la

2026-04-30·3 мин
LLM
LLM·MarkTechPost

DeepSeek, Google et Meta : 10 techniques de compression de KV-cache pour LLM afin de réduire la mémoire en inférence

KV-cache est devenu un gourmand de mémoire GPU dans les grands LLM, et une nouvelle revue présente 10 approches — de H2O et SnapKV à TurboQu

2026-04-30·3 мин
LLM
LLM·MarkTechPost

Poolside a lancé Laguna XS.2 et M.1 — des modèles ouverts pour la programmation multi-agents

Poolside a présenté deux modèles Laguna pour le codage multi-agents : le XS.2 ouvert s'exécute localement, tandis que le plus puissant M.1 e

2026-04-29·3 мин
LLM
LLM·MarkTechPost

LlamaIndex ParseBench : comment tester l'analyse de documents via Python et Hugging Face

Un guide pratique montre comment construire un pipeline d'évaluation des analyseurs de documents à l'aide du dataset LlamaIndex ParseBench :

2026-04-29·3 мин
LLM
LLM·MarkTechPost

smol-audio de Deep-unlearning : Une collection de notebooks Colab pour l'affinage des modèles audio

Deep-unlearning a lancé smol-audio — une collection de notebooks compatibles avec Colab pour l'affinage de Whisper, Parakeet, Voxtral, Grani

2026-04-29·3 мин
LLM
LLM·MarkTechPost

Top 10 des modèles d'IA physique qui contrôlent les robots réels en 2026

En 18 mois, l'écart entre les LLM et la robotique réelle s'est considérablement réduit : les modèles d'IA physique fonctionnent déjà dans le

2026-04-28·2 мин
LLM
LLM·MarkTechPost

Hugging Face et Gemma 3 1B: Construire un Pipeline de Génération Prêt pour la Production dans Colab

Une analyse de la manière d'exécuter Gemma 3 1B Instruct dans Colab via Hugging Face Transformers: avec une autorisation sécurisée, des chat

2026-04-28·3 мин
LLM
LLM·MarkTechPost

Z.ai lance GLM-5V-Turbo — modèle multimodal natif pour la programmation visuelle

Le laboratoire chinois Z.ai a lancé GLM-5V-Turbo — un modèle qui reconnaît les diagrammes architecturaux et les captures d'écran et génère i

2026-04-28·3 мин
LLM
LLM·MarkTechPost

Google Gemma 4, NVIDIA et OpenClaw : Agents IA locaux sans facturation par token

Google et NVIDIA promeuvent le déploiement local de Gemma 4 sur RTX, Jetson et DGX Spark pour que les agents IA toujours actifs comme OpenCl

2026-04-28·3 мин
LLM
LLM·MarkTechPost

Talkie-1930: Les chercheurs ont lancé un modèle 13B sans connaissance d'Internet et de la Seconde Guerre mondiale

Talkie-1930 est un modèle 13B ouvert, entraîné uniquement sur des textes en anglais jusqu'en 1931, pour étudier la pensée historique, les fu

2026-04-28·3 мин
LLM
LLM·MarkTechPost

MarkTechPost montre comment construire un agent VLA léger avec un modèle de monde latent et MPC

Dans un nouveau tutoriel, MarkTechPost explique comment construire un agent incarné simplifié : il fonctionne sur des images RGB, apprend un

2026-04-28·2 мин
LLM
LLM·MarkTechPost

Arcee AI a Lancé Trinity Large Thinking — Modèle de Raisonnement Ouvert pour Agents IA

Arcee AI a libéré les poids de Trinity Large Thinking sous licence Apache 2.0 et mise sur les scénarios d'agents longs, le raisonnement mult

2026-04-28·2 мин
LLM
LLM·MarkTechPost

NVIDIA a présenté un pipeline complet d'optimisation de modèles avec FastNAS pruning et fine-tuning

NVIDIA a publié un guide pratique pour Model Optimizer : dans un seul notebook Colab sont démontrés l'entraînement de ResNet20, FastNAS prun

2026-04-28·3 мин
LLM
LLM·MarkTechPost

TII lance Falcon Perception — modèle 0,6B pour la segmentation et la recherche d'objets par texte

TII a présenté Falcon Perception — un modèle vision-langage compact avec 0,6 milliard de paramètres qui recherche et segmente des objets à p

2026-04-28·3 мин
LLM
LLM·MarkTechPost

Google DeepMind Permet aux LLM de Réécrire les Algorithmes de la Théorie des Jeux et de Surpasser les Experts

Google DeepMind a démontré qu'AlphaEvolve peut réécrire le code des algorithmes pour les jeux avec information incomplète et trouver des sol

2026-04-28·3 мин
LLM
LLM·MarkTechPost

Z.AI a montré comment construire des systèmes agentic production-ready sur GLM-5 avec tool calling

Z.AI a lancé un tutoriel détaillé sur GLM-5 : de la configuration du SDK et de l'API compatible avec OpenAI au streaming, tool calling, sort

2026-04-28·3 мин
LLM
LLM·MarkTechPost

Netflix Lance Void — Modèle pour Supprimer les Objets des Vidéos en Tenant Compte de la Physique de la Scène

L'équipe de Netflix et INSAIT a publié en open source Void — un système qui supprime les objets des vidéos tout en recalculant simultanément

2026-04-28·3 мин
LLM
LLM·MarkTechPost

Comment l'Intelligence Artificielle Aide les Marques de Mode à Concevoir la Mode du Futur

Les algorithmes aident déjà les marques de mode à créer des collections plus rapidement, à prévoir les tendances, à réduire la surproduction

2026-04-28·3 мин
LLM
LLM·MarkTechPost

Comment Construire un Pipeline Netflix Void pour la Suppression d'Objets dans les Vidéos en Utilisant CogVideoX

Un examen détaillé montre comment déployer le modèle Netflix Void, télécharger les points de contrôle nécessaires, préparer les données d'en

2026-04-28·2 мин
LLM
LLM·MarkTechPost

Gladstone Institutes présente MaxToki — un modèle d'IA qui prédit le vieillissement cellulaire

Le modèle MaxToki de Gladstone Institutes apprend à voir non pas un 'instantané' de la cellule, mais sa trajectoire au fil du temps, évalue

2026-04-28·3 мин
LLM
LLM·MarkTechPost

TinyFish Lance une Plateforme Web Unifiée pour Agents IA avec Search, Fetch, Browser et Agent

TinyFish a combiné la recherche, le rendu de pages, les sessions de navigateur et les flux de travail web autonomes dans une plateforme uniq

2026-04-28·3 мин
LLM
LLM·MarkTechPost

Google a ajouté Skills dans Chrome et transformé les prompts d'IA en scénarios à un clic

Google a lancé la fonctionnalité Skills dans Chrome : les utilisateurs de Gemini pourront enregistrer les prompts fréquemment utilisés comme

2026-04-28·2 мин
LLM
LLM·MarkTechPost

Google DeepMind Présente Gemini Robotics-ER 1.6 pour l'Autonomie et la Lecture d'Instruments par les Robots

Google DeepMind a mis à jour Gemini Robotics-ER à la version 1.6 : un modèle pour robots qui comprend mieux l'espace, gère plusieurs flux vi

2026-04-28·2 мин
LLM
LLM·MarkTechPost

MarkTechPost a détaillé le cycle complet d'entraînement des grands modèles de langage : des données au déploiement

MarkTechPost a publié une analyse détaillée de la façon dont les LLM sont construits aujourd'hui : du préentraînement sur de grands corpus à

2026-04-28·3 мин
LLM
LLM·MarkTechPost

Google a présenté Gemini 3.1 Flash TTS — modèle de parole avec contrôle, dialogues et 70+ langues

Google a lancé Gemini 3.1 Flash TTS en aperçu : le modèle synthétise du texte en 70+ langues, supporte les dialogues avec deux voix et perme

2026-04-28·3 мин
LLM
LLM·MarkTechPost

Mem0 et OpenAI : comment construire une couche universelle de mémoire à long terme pour les agents IA

Un nouveau tutoriel décortique la combinaison de Mem0, des modèles OpenAI et ChromaDB : elle extrait les faits des conversations ordinaires,

2026-04-28·2 мин
LLM
LLM·MarkTechPost

SmolAgents : Comment Construire un Système d'IA Multi-Agent avec Code et Orchestration Dynamique

Une analyse de l'implémentation de SmolAgents montre comment les agents d'IA légers exécutent du code, invoquent des outils, gèrent la mémoi

2026-04-28·2 мин
LLM
LLM·MarkTechPost

NetKet et JAX : comment construire un modèle Transformer pour les systèmes de spins frustrés

Le guide montre comment construire un pipeline de VMC de recherche en utilisant NetKet, JAX et l'architecture Transformer pour modéliser une

2026-04-28·3 мин
LLM
LLM·MarkTechPost

OpenAI a présenté GPT-Rosalind — un modèle d'IA pour la biologie, la génomique et le développement de médicaments

OpenAI a lancé GPT-Rosalind — un modèle spécialisé pour la biologie et la pharmacie qui aide à accélérer le développement de médicaments, l'

2026-04-28·3 мин