Habr AI

PSB a montré comment il intègre l'IA dans la banque : chatbots, RAG et services métier
PSB a révélé comment il utilise l'IA générative pour les PME et ses collaborateurs : via l'assistant "Katyusha", des consultations RAG, des

Yandex Cloud explique pourquoi le frontend mène l'intégration de l'IA dans DataLens
Yandex Cloud a démontré via DataLens comment déplacer la première couche d'intégration de l'IA vers un BFF frontend, permettant un lancement

Claude Code sur Windows : comment configurer un environnement de travail stable et rapide
Un ingénieur de l'équipe AWS gérant 150+ comptes a documenté comment obtenir un fonctionnement stable et rapide de Claude Code sur Windows s

Anthropic, OpenAI et LangChain ont expliqué pourquoi les agents IA ont besoin d'un harness
Anthropic, OpenAI et LangChain déplacent leur focus des modèles eux-mêmes vers agent harness — une couche d'orchestration, de mémoire et d'o

Anthropic et autres modèles de langage peuvent invoquer des outils cachés sans autorisation
Un chercheur a décrit une faille dans laquelle Anthropic, Gemini et Grok peuvent invoquer un outil non autorisé si la fonction existe dans l

Le groupe fintech "Svoi" explique comment rendre les agents LLM moins coûteux et plus précis en code
L'équipe du groupe fintech "Svoi" a publié un guide pratique sur la façon de transformer les LLM de "recherche améliorée" en agent géré, réd

Comment un Auteur Habr a Transformé Sept Scénarios n8n en un Système Autonome d'Actualités IA
En un mois et demi, l'auteur a transformé un ensemble fragile de sept scénarios n8n en un pipeline Python unifié avec 11 workers, 5 agents I

TAPe atteint la détection au niveau RF-DETR et YOLO sur COCO avec moins de 100 000 paramètres
Les auteurs de TAPe ont affirmé avoir atteint la détection COCO au niveau des modèles RF-DETR et YOLO forts, tout en maintenant moins de 100

Pourquoi OpenCode et les modèles puissants écrivent des tests verts mais inutiles — et comment les corriger
Un modèle récent et un agent puissant comme OpenCode ne sauvent pas si la base de code est remplie de any-types, et l'équipe demande à l'IA

NVIDIA ouvre un accès API gratuit à plus de 100 modèles d'IA avec compatibilité OpenAI
NVIDIA a commencé à émettre des clés gratuites pour accéder à plus de 100 modèles d'IA : les développeurs obtiennent une API compatible avec

Pourquoi le cerveau est des centaines de millions de fois plus efficace que GPT-4 et où vont les puces neuromorphes
L'auteur explore pourquoi le cerveau humain consomme des ordres de grandeur moins d'énergie pour les tâches cognitives que GPT-4, et comment

Recherche sur ChatGPT : la forme grammaticale féminine dans le prompt affecte-t-elle la qualité de résolution des tâches ?
Une expérience menée par l'auteur sur LiveCodeBench a montré que dans GPT-5.4 mini, l'auto-présentation féminine dans un prompt en russe réd

RuStore a déployé l'IA en sécurité de l'information : comment VK automatise l'examen des tâches, du code et les tests DAST
L'équipe de sécurité de RuStore utilise l'IA pour le triage initial des tâches de sécurité, l'examen des merge requests et les tests dynamiq

OpenGrall a Présenté une Architecture pour Robots IA où le Modèle de Langage Gère la Stratégie
Le framework OpenGrall propose de diviser la cognition et le contrôle : le modèle de langage gère la stratégie, tandis que TinyML gère l'exé

Habr AI : Comment Pipeline Triad Construit un Pipeline d'Agents IA Plutôt qu'une Équipe de Développement
Habr AI a examiné Pipeline Triad — un modèle où les étapes de développement passent par des triades d'agents IA, les humains n'intervenant q

Gramax a montré comment comparer la qualité des réponses RAG sans évaluation manuelle subjective
Gramax a expliqué pourquoi les métriques de retrieval sont insuffisantes pour RAG et a proposé d'évaluer non pas les chunks récupérés, mais

Comment les guardrails pour LLM en Java bloquent les injections et les réponses toxiques
Une analyse de la raison pour laquelle un seul system prompt est insuffisant pour protéger les LLMs, et comment les guardrails en Java inter

Anthropic et Mythos : pourquoi une menace pour les banques s'est rapidement transformée en risque pour tous
Anthropic a présenté Mythos comme trop dangereuse pour un accès public, mais le vrai risque s'est avéré ne pas être dans le secteur bancaire

Anthropic et Claude Mythos : pourquoi les critiques qualifient le lancement du modèle de spectacle de relations publiques onéreux
Une colonne critique sur Claude Mythos affirme qu'Anthropic vend non seulement un modèle d'IA, mais aussi un mythe sur sa nature quasi humai

Assistants IA en 2026 : Comment un Développeur Solo Est Devenu Plus Rapide qu'une Équipe de Trois Personnes
L'auteur démontre qu'en 2026, un développeur seul équipé d'un ensemble d'outils IA open-source peut écrire, tester et faire des commits de c

ecom.tech a comparé l'ajustement fin évolutionnaire de Qwen3-4B avec SFT et GRPO pour les tests Kotlin
L'équipe ecom.tech a affiné Qwen3-4B-Instruct pour générer des tests unitaires en Kotlin et a montré que l'algorithme évolutionnaire surpass

Yandex Code Assistant testé sur la gestion des secrets et comparé à Cursor
Un ingénieur d'« Infosystems Jet » a testé Yandex Code Assistant sur la gestion des secrets et montré que l'agent se rapproche déjà de Curso

Claude et Qwen Omni : comment un développeur a intégré l'analyse vidéo dans son pipeline de production
Un auteur sur Habr a connecté Claude à Qwen Omni pour contourner l'absence de traitement vidéo natif et catégoriser automatiquement 29 référ

Comment Sovcombank a Réduit les Tâches Routinières de l'Équipe Produit de 50% Grâce à un Assistant IA
Chez Sovcombank, ils ont construit un assistant IA basé sur LLM et un prompt unifié pour soulager les product managers de la documentation,

Des critiques qualifient le partenariat d'OpenAI avec McKinsey et Accenture de pari sur le AI hype
L'auteur d'une colonne virulente soutient que le programme Frontier Alliances d'OpenAI vend aux entreprises non pas une solution prête à l'e

Google Veo, Runway et Kling figurent parmi les meilleurs générateurs vidéo IA gratuits en 2026
Les auteurs ont comparé dix générateurs vidéo gratuits populaires, notamment Google Veo, Runway et Kling, et les ont testés sur une scène co

Rufler simplifie les essaims d'agents dans Claude Code : une seule config au lieu d'une orchestration manuelle
L'outil open-source Rufler réduit le lancement d'agents autonomes dans Claude Code à une seule configuration, assemble automatiquement les r

Claude Code a aidé à construire une application d'analyse de graphes en moins d'une heure — étude de cas développeur
Un développeur avec des attentes peu élevées a construit une application fonctionnelle d'analyse de graphes en environ une heure, mais a ens

IBS explique comment les réseaux de neurones changent la conception de logiciels et pourquoi ils ne remplaceront pas les architectes
IBS analyse comment les grands modèles de langage et les outils génératifs aident à concevoir des systèmes, à comparer les compromis et à ac

Playwright et MCP : comment un agent IA teste l'UI et la base de données sans assertions SQL manuelles
Un agent Playwright combiné avec MCP peut non seulement exécuter le checkout dans le navigateur, mais aussi vérifier immédiatement les chang