MarkTechPost

Google a présenté Auto-Diagnose — un système d'IA pour identifier les causes des défaillances des tests d'intégration
Google a présenté Auto-Diagnose — un système basé sur Gemini 2.5 Flash qui analyse automatiquement les journaux des tests d'intégration défa

OpenAI GPT-OSS : Lancement de Modèles Open-Weight dans Colab avec MXFP4 et Inférence Avancée
Un nouveau guide explique comment lancer openai/gpt-oss-20b dans Google Colab : installer les dépendances pour Transformers, vérifier le GPU

Anthropic sort Claude Opus 4.7 pour la programmation d'agents, la vision et les tâches autonomes
Anthropic a présenté Claude Opus 4.7 — une mise à jour du modèle phare avec des améliorations notables en codage d'agents, analyse d'images

PrismML Bonsai : Comment exécuter un modèle 1 bit sur CUDA avec GGUF, JSON et RAG
Dans un nouveau tutoriel PrismML Bonsai, nous avons couvert comment exécuter Bonsai-1.7B sur GPU via CUDA et GGUF, mesurer le débit, configu

xAI lance des APIs Grok séparées pour la reconnaissance et la synthèse vocale pour les développeurs d'entreprise
xAI a divisé la pile vocale de Grok en APIs autonomes : Speech-to-Text et Text-to-Speech pour les entreprises avec des prix agressifs, un su

NVIDIA a lancé Ising — la première famille ouverte de modèles d'IA pour les systèmes quantiques-classiques
NVIDIA a présenté Ising — une famille ouverte de modèles d'IA pour l'étalonnage des processeurs quantiques et la correction d'erreurs, pour

Pourquoi LoRA se casse en production et comment RS-LoRA sauve le fine-tuning des modèles
LoRA excelle avec le style et le format, mais perd le signal lors de l'ajustement avec de nouveaux faits ; RS-LoRA résout le problème en cha

OpenKB et OpenRouter montrent comment construire une base de connaissances IA locale avec recherche Llama
Un nouveau tutoriel explique comment déployer une base de connaissances locale sur OpenKB, connecter un modèle ouvert via OpenRouter et conf

OpenAI et Magika ont montré comment construire un pipeline pour la reconnaissance de fichiers et l'analyse des menaces
Le guide démontre un pipeline pratique où Magika détermine le type réel du fichier à partir des octets, et OpenAI aide à interpréter le résu

Meta a présenté Sapiens2 — un modèle unifié de vision par ordinateur pour la pose, la segmentation et la 3D
Meta Reality Labs a lancé Sapiens2 — une famille de modèles de vision pour l'analyse humaine qui résout la pose, la segmentation, la géométr

OpenMOSS lance MOSS-Audio — un modèle audio ouvert surpassant les alternatives plus volumineux
OpenMOSS a présenté MOSS-Audio — un modèle ouvert qui comprend la parole, la musique et les sons ambiants dans une seule architecture et sur

Embeddings OpenAI et RL : Comment Construire un Agent avec Mémoire à Long Terme pour des Réponses Précises
Le tutoriel montre comment entraîner un agent RL pour sélectionner les enregistrements pertinents de la mémoire à long terme, afin qu'un LLM

Comment Mesurer l'Intelligence Réelle : Les Principaux Benchmarks pour les Agents IA
Les tests classiques ne reflètent plus les capacités réelles des réseaux de neurones. Nous explorons quels benchmarks montrent véritablement

Mémoire Élastique pour l'IA : Comment kvcached Résout la Pénurie de GPU
La distribution dynamique du cache KV promet de réduire drastiquement le coût d'hébergement des modèles de langage en permettant un partage

Le Modèle Vocal de xAI Surpasse GPT Realtime dans les Tâches Métier
L'entreprise d'Elon Musk, xAI, a présenté grok-voice-think-fast-1.0. Le nouveau modèle a surpassé les solutions d'OpenAI et Google dans la g

GitNexus : Comment un nouvel outil a appris aux agents IA à comprendre structurellement le code
Les assistants IA excellent à écrire du code local, mais ne comprennent souvent pas l'architecture globale des projets. Le projet open-sourc

DeepSeek-V4 : Comment les nouveaux algorithmes de compression ont rendu le contexte d'un million de tokens réalité
DeepSeek a présenté la quatrième génération de ses modèles. Grâce à la compression radicale de l'attention, le traitement de volumes massifs

L'Architecture Decoupled DiLoCo de DeepMind Résout le Problème de Scalabilité de l'IA
L'entraînement de modèles d'IA avancés a toujours été tenu en otage par les pannes matérielles : la défaillance d'une puce arrêtait tout le

OpenMythos : reconstruction open-source de l'architecture Claude Mythos en PyTorch avec 770M paramètres
Le développeur Kye Gomez a reconstruit l'architecture présumée Claude Mythos d'Anthropic à partir de zéro — sans fuite, uniquement sur la ba

OpenAI Déploie GPT-5.4-Cyber pour les Professionnels de la Cybersécurité Vérifiés
OpenAI ouvre un accès large à GPT-5.4-Cyber — une version affinée de GPT-5.4 sans restrictions standard pour des milliers de défenseurs véri

Moonshot AI lance Kimi K2.6 : un modèle agentique avec un essaim de 300 sous-agents
Le laboratoire chinois Moonshot AI a ouvert le code source de Kimi K2.6, un modèle agentique multimodal capable de coordonner de manière aut

Phi-4-Mini de Microsoft : implémentation de la quantification, de RAG et de LoRA dans un seul notebook Jupyter
Le tutoriel présente le pipeline complet avec Phi-4-mini-instruct : quantification 4 bits, génération en streaming, raisonnement, appel d'ou

Qwen 3.6-35B-A3B en pratique : multimodalité, MoE et RAG dans un même pipeline
Une analyse détaillée de l’implémentation de Qwen 3.6-35B-A3B, du chargement du modèle à la mise en place de RAG, du tool calling et de la p

NVIDIA представила Nemotron 3 Super — открытую модель со 120 млрд параметров
Новая гибридная модель сочетает архитектуры Mamba и Attention с подходом Mixture-of-Experts, обеспечивая пятикратный прирост производительно

Google представила TensorFlow 2.21 и LiteRT для мобильного ИИ
Google представила TensorFlow 2.21 и LiteRT — новый стандарт для запуска нейросетей на смартфонах с поддержкой NPU и ускорением GPU для моби

Google запустила Android Bench для оценки ИИ в мобильной разработке
Google открыла доступ к Android Bench — первому специализированному инструменту для проверки навыков больших языковых моделей в разработке п

OpenAI представила Codex Security для автоматического поиска и исправления уязвимостей в коде
OpenAI запускает Codex Security — интеллектуального агента для анализа безопасности кода, который не только находит ошибки, но и предлагает

Liquid AI выпустила систему для запуска ИИ-агентов полностью на устройстве
Компания Liquid AI представила модель LFM2-24B-A2B и приложение LocalCowork — связку для выполнения сложных рабочих процессов с ИИ-агентами

Yuan 3.0 Ultra: триллион параметров при рекордной эффективности
Китайская YuanLab AI представила открытую мультимодальную модель с триллионом параметров, которая активирует лишь 68,8 млрд из них. Сокращен

Alibaba выпустила OpenSandbox — единую среду для безопасной работы AI-агентов
Alibaba открыла исходный код OpenSandbox — инструмента, который даёт AI-агентам изолированные песочницы для выполнения кода, веб-сёрфинга и