Habr AI

NextFilm décrit un modèle de recommandation de films : cold start, vecteur de goût et couche GPT
L'auteur de NextFilm a montré comment recommander des films aux nouveaux utilisateurs : collecter les notes initiales, construire un vecteur

Le développeur de n0x a appris à son agent de navigateur à ouvrir des sites et à prendre des captures d'écran
Le projet n0x est passé d'un simple chatbot linguistique à un agent de navigateur avec support MCP : il ouvre maintenant des sites Web, pren

Anthropic teste Claude Mythos : une fuite révèle un modèle à 10 billions de paramètres
Une fuite interne d'Anthropic a révélé Claude Mythos — un modèle que l'entreprise considère comme son IA le plus puissant et qu'elle n'est p

Anthropic et OpenClaude : pourquoi le Claude Code « gratuit » en 2026 n'est pas vraiment gratuit
Après la fuite du code source de Claude Code, la communauté a rapidement assemblé OpenClaude, mais derrière la promesse d'un codage AI gratu

Comment une unique instruction système transforme un LLM en outil fiable : tests sur Qwen et DeepSeek
Un unique prompt système peut éliminer les hallucinations des LLM : une expérience avec Qwen et DeepSeek a montré qu'un 'exosquelette' de rè

T-Technologies sur l'open source en AI/ML : comment le travail avec les LLM est organisé en interne
Entretien avec l'équipe AI/ML du Groupe T-Technologies — sur le développement des LLM, la participation à l'open source et la direction de r

NVIDIA à la GTC 2026 change son focus des puces vers les usines de tokens et l'ère d'Agent-as-a-Service
À la GTC 2026, NVIDIA a présenté un pari non pas sur les GPU individuels, mais sur les usines de tokens, l'architecture modulaire Vera Rubin

PageIndex de VectifyAI propose une recherche sans embeddings pour les longs documents
PageIndex construit un index hiérarchique du document et recherche les sections pertinentes par raisonnement LLM, promettant la RAG sans emb

GolangConf 2026 et Ontiko : pourquoi les équipes Go doivent corriger l'architecture, pas la vitesse du code
Ontiko restructure GolangConf 2026 autour des vrais problèmes des équipes Go : l'IA a accéléré la rédaction de code, mais les décisions arch

ruGPT3XL Gagne un Contexte de 8k : le Modèle Restauré Dépasse la Limite de 2k avec des Pertes Minimales
L'auteur de la restauration de ruGPT3XL a corrigé sparse attention, augmenté le contexte du modèle de 2k à 8k et préservé la qualité sur les

OpenAI, MiniMax et Nvidia ont donné le ton de mars en IA : Sora, GPT-5.4 et le pari sur Mira Murati
Mars dans l'IA a été marqué par de grands changements de produits : OpenAI reconsidère l'avenir de Sora, Google et Anthropic accélèrent leur

Startups AI-first : pourquoi le growth marketing s'enlise et ce qui se casse dans l'entonnoir
Les produits AI-first ont souvent des métriques fortes en haut de l'entonnoir qui masquent une fausse demande : les gens viennent pour la no

Habr : Les agents IA transforment le delivery, et les équipes doivent reconstruire tout le cycle de développement
Habr explique pourquoi avec l'émergence des agents IA, les équipes doivent restructurer non seulement la rédaction de code mais tout le deli

M2 a confié 40% de ses textes marketing à un réseau neuronal et a préservé la qualité du contenu
L'équipe de M2 a intégré un rédacteur IA dans son département éditorial interne, délégué 40% de ses textes produits et marketing au modèle e

Sova AI a lancé un assistant Android qui contrôle le téléphone sans PC ni root
Sova AI a présenté une application Android avec un agent IA qui ouvre des applications, appuie sur les boutons, fait défiler les écrans et e

API OpenAI et Requêtes Fan-Out de GPT : Comment les Spécialistes SEO Analysent la Recherche par IA
L'auteur démontre comment récupérer les requêtes fan-out cachées de GPT via l'API OpenAI et les utiliser pour analyser comment les modèles d

Hack The Box : Comment MCP Inspector Transforme les Outils d'IA en un Nouveau Vecteur d'Attaque
Une analyse de Kobold du HTB Season 10 montre comment un seul utilitaire dev pour les serveurs d'IA peut conduire à RCE, LFI, réutilisation

Un système basé sur LLM a réduit la préparation des cartes de contrôle qualité en usine sidérurgique de 2 heures à 5 minutes
Dans une usine sidérurgique, un système LLM a commencé à assembler des cartes de contrôle qualité en 3–5 minutes au lieu de deux heures : no

Habr AI montre comment ajouter la mémoire et le contexte à un chat LLM en Python avec Ollama et LiteLLM
Dans une nouvelle partie du tutoriel sur le chat en Python avec Ollama et LiteLLM, l'auteur montre comment stocker l'historique des messages

Claude Sonnet et Jarvis Pattern : pourquoi les agents IA pourraient ne nécessiter qu'un système d'exploitation
Sur Habr, les développeurs ont proposé de construire des agents IA personnels non autour de frameworks complexes, mais sur une combinaison d

Yandex a montré comment accéder aux réponses d'Alice et mesurer la visibilité dans la recherche
Yandex a lancé une section 'Visibilité du Site dans Alice' dans Webmaster. Le message aux entreprises est clair : les réponses de l'assistan

Flant : comment un développeur Go a transformé Zed et Gemini en un agent IA utile
Un développeur Go de Flant a décrit le chemin qui va des plugins IDE lents à une combinaison de Zed, Gemini 3 Flash et gopls-mcp, qui fourni

Agentis Memory : Stockage Compatible Redis avec Recherche Vectorielle et Embeddings Locaux
Agentis Memory transforme un stockage compatible Redis en mémoire partagée pour les agents IA : avec embeddings locaux, recherche vectoriell

Habr : comment les données synthétiques aident à entraîner des modèles et pourquoi l'auto-entraînement conduit à l'effondrement
Les données synthétiques aident l'IA à compenser la pénurie de corpus de haute qualité générés par l'homme, mais avec un auto-entraînement i

Pourquoi ChatGPT et Gemini ne recommandent pas votre B2B SaaS, même si votre site est bien conçu
Même un site B2B SaaS bien conçu peut ne pas apparaître dans les réponses de ChatGPT, Gemini et Perplexity si votre marque manque d'une caté

Pourquoi l'IA en design d'interface est importante non pour la production, mais comme source de mutations visuelles
L'interface utilisateur générée par IA est précieuse non seulement pour la rapidité des croquis : sa force réside dans les combinaisons visu

Qwen et llama.cpp : comment exécuter un réseau neuronal local sans cloud sur votre ordinateur ou serveur
Un guide pratique expliquant comment exécuter le modèle Qwen via llama.cpp sur votre propre ordinateur ou serveur pour travailler avec un ré

Anthropic et Claude Cowork : 10 tâches professionnelles que l'IA retire aux humains
Claude Cowork d'Anthropic montre comment l'IA assume les briefings matinaux, les propositions, les réponses aux clients et les rapports, lib

Directum : pourquoi les entreprises discutent activement des agents IA mais hésitent à les déployer dans leurs processus
Directum explique pourquoi les agents IA sont devenus la principale tendance corporative, mais l'adoption de masse est entravée par une infr

ClawRouter a réduit les coûts des LLM API de 47 $ à 1,80 $ par semaine — examen du routeur intelligent
ClawRouter analyse chaque requête selon 15 paramètres et l'achemine vers le modèle le plus approprié et économique — réduisant les dépenses