Habr AI

Anthropic et ETH Zurich : un CLAUDE.md trop long dégrade les performances de l'agent et augmente les coûts
Une étude d'ETH Zurich portant sur 138 dépôts montre que des fichiers CLAUDE.md et AGENTS.md trop longs réduisent souvent le taux de réussit

Gemini 3.1 Pro a surpassé ChatGPT 5.4 et Claude Opus 4.6 dans un test de génération de texte
Une comparaison menée par l’auteur entre trois modèles de premier plan sur quatre exercices littéraires a montré que Gemini 3.1 Pro maîtrise

Anthropic, OpenAI et Cursor : huit niveaux de maturité de l’ingénierie des agents
Habr AI a analysé huit niveaux de l’ingénierie des agents, du tab-complete et du context engineering aux background agents et aux équipes au

AMD RX580 a fait tourner un LLM en local : comment venir à bout de ROCm, d'Ollama et obtenir une inférence sur GPU
Un ingénieur a montré comment faire tourner de façon stable un LLM sur une ancienne AMD RX580 via ROCm et Ollama, en détaillant les faux sig

Pourquoi Claude 4.6 ne suffit pas sans contexte : le principal angle mort du développement avec les LLM
Même un modèle solide comme Claude 4.6 perd en efficacité sans un contexte réuni de manière systématique : knowledge base, liens entre servi

Un développeur crée un agrégateur d'actualités avec AI, MCP, DeepSeek et un bot Telegram
Après l'attaque de drones au-dessus de Dubaï, un développeur a créé un agrégateur d'actualités multilingue : 80+ sources, un serveur MCP pou

BorisovAI a testé MoE sur une RTX 4090 et a montré pourquoi la perplexité fausse l’évaluation des LLM
BorisovAI a testé MoE avec des experts plug-in sur une seule RTX 4090 et a constaté qu’une perplexité flatteuse ne garantit pas un vrai gain

Une expérience avec un LLM a montré comment la « personnalité » du modèle émerge dans l’espace latent
Une expérience avec un LLM modulaire a montré qu’un vecteur latent distinct peut stocker non seulement le style du texte, mais aussi des tra

Nvidia laisse entrevoir, avant la GTC 2026, une puce optique capable de redessiner les centres de données AI
Avant sa prise de parole du 16 mars 2026, Nvidia a alimenté les attentes du marché avec la promesse d’« une puce qui va secouer le monde »,

Pourquoi les avancées de DeepMind en AGI ne répondent pas à la question centrale de la conscience machinique
L'auteur explique pourquoi l'augmentation de la puissance de calcul et les avancées de DeepMind en AGI ne signifient pas l'émergence de la c

Habr AI sur l’avenir du travail : comment AI et les robots pourraient ramener la société à une nouvelle Antiquité
Habr AI estime que l’association de AI, de la robotisation et des neuroimplants pourrait non seulement transformer le marché du travail, mai

Unity a montré comment créer des PNJ vocaux avec mémoire et contexte du monde
Un guide pas à pas montre comment créer dans Unity des PNJ vocaux avec un modèle local, une mémoire des dialogues, une connaissance du monde

Harvard : AI réduit les recrutements de juniors, et dans trois ans cela pourrait toucher tout le secteur
Harvard constate une baisse des recrutements de juniors après l’adoption d’AI, tandis que METR pointe une dépendance croissante des développ

DeepSeek et GLM-5 ont dépassé Yandex dans un test de 34 modèles d’AI pour managers sans VPN
Les auteurs d’un vaste test de scénarios managériaux ont constaté que DeepSeek V3.2 et GLM-5, accessibles en Russie sans VPN, sont nettement

Google a lancé Gemini Embedding 2 pour le RAG multimodal avec vidéo, audio et PDF
Google a lancé Gemini Embedding 2, un modèle qui vectorise le texte, les images, la vidéo, l’audio et les PDF dans un espace unique et simpl

Bitrix24 a recensé huit erreurs typiques dans le développement de serveurs MCP pour les LLM
Un développeur de Bitrix24 a expliqué pourquoi les serveurs MCP échouent sur l’autorisation, les chaînes d’appels, les mauvaises description

Pourquoi l'idée de world model de Yann LeCun ne résout pas la principale crise du développement des LLM
Après le départ de Yann LeCun de Meta, son concept de world model est de nouveau discuté comme une voie au-delà des LLM, mais les critiques

Un pipeline de Physical AI pour le SO-101 a été assemblé sur la base de ROS2 et LeRobot pour 30 000 roubles
Une stack open source basée sur ROS2 et LeRobot permet de construire un pipeline complet de Physical AI sur le SO-101 à bas coût : téléopéra

SimpleOne a lancé SimpleGen — un outil AI pour le développement et le déploiement sur la plateforme
SimpleOne a présenté SimpleGen — un outil AI de génération de solutions sur sa plateforme : le développeur n'a qu'à préparer un dépôt, un ac

Google AI Ultra : comment transformer un abonnement en pool d'agents parallèles et en consensus entre modèles
Google AI Ultra est proposé comme base d'une stack multi-agents : lancer des workers Gemini en parallèle, déléguer les tâches routinières et

Sam Altman et le Pentagone : comment les contrats militaires pourraient devenir une assurance pour OpenAI
Une tribune sur le lien entre OpenAI et le Pentagone affirme que les contrats militaires apportent à l'entreprise de Sam Altman non seulemen

OpenAI a lancé GPT-5.4 Pro : de nouveaux records sur ARC-AGI-2, FrontierMath et en logique
OpenAI a présenté GPT-5.4 Pro — un modèle qui progresse fortement sur des benchmarks difficiles, résout mieux les tâches de raisonnement et

nullClaw en Zig a dépassé OpenClaw sur la consommation mémoire et le démarrage lors de tests locaux d’agents AI
nullClaw, un runtime AI léger en Zig, a montré un démarrage quasi instantané et une consommation mémoire plusieurs fois inférieure dans une

Le ChatGPT 5.4 d'OpenAI a surpassé Claude Opus 4.6 et Gemini 3.1 Pro dans une comparaison sur Habr
Habr a publié une comparaison de trois modèles phares sur des tâches courantes : ChatGPT 5.4 a pris la première place au score total, Gemini

Étude : Cursor accélère le démarrage du développement, mais accroît ensuite la dette technique de l’équipe
Une étude sur Cursor a montré que l’assistant AI accélère fortement la production de code au cours des premières semaines, mais augmente ens

Yandex au AI Dev Day a montré comment l'IA change déjà le développement chez Avito, Ozon et T-Bank
Lors d'AI Dev Day, les entreprises Yandex, Avito, Ozon, T-Bank et Sber ont montré où l'IA accélère déjà le développement et où l'effet est e

Comment AI change le développement indie : il devient de plus en plus difficile pour les développeurs solo de rivaliser
L'auteur de la chronique estime que AI a accéléré le lancement des MVP, mais a aussi relevé la barrière à l'entrée, intensifié la concurrenc

Une entreprise sans managers : trois pièges dans lesquels les entreprises tombent en déployant AI
Sur 50 dirigeants au ProIT Fest, seuls trois ont dit que AI avait réellement simplifié la prise de décision — alors même que les entreprises

Bitrix24 a montré comment ajouter quatre robots d'automatisation à un portail d'entreprise
Bitrix24 a publié la suite de sa série pratique et a montré comment intégrer quatre robots dans un portail d'entreprise: pour nettoyer les n

Anthropic a expliqué comment créer des skills pour Claude Code et pourquoi les équipes ont besoin de leur propre marketplace
Anthropic a montré quels skills fonctionnent vraiment dans Claude Code, comment les écrire sans bruit inutile et pourquoi les grandes équipe