Источник

Habr AI

708

всего статей

403

за неделю

30 апреля

последнее обновление

RSS Оригинал →

LLM·Habr AI

NextFilm décrit un modèle de recommandation de films : cold start, vecteur de goût et couche GPT

L'auteur de NextFilm a montré comment recommander des films aux nouveaux utilisateurs : collecter les notes initiales, construire un vecteur

2026-04-28·3 мин

LLM·Habr AI

Le développeur de n0x a appris à son agent de navigateur à ouvrir des sites et à prendre des captures d'écran

Le projet n0x est passé d'un simple chatbot linguistique à un agent de navigateur avec support MCP : il ouvre maintenant des sites Web, pren

2026-04-28·3 мин

LLM·Habr AI

Anthropic teste Claude Mythos : une fuite révèle un modèle à 10 billions de paramètres

Une fuite interne d'Anthropic a révélé Claude Mythos — un modèle que l'entreprise considère comme son IA le plus puissant et qu'elle n'est p

2026-04-28·2 мин

LLM·Habr AI

Anthropic et OpenClaude : pourquoi le Claude Code « gratuit » en 2026 n'est pas vraiment gratuit

Après la fuite du code source de Claude Code, la communauté a rapidement assemblé OpenClaude, mais derrière la promesse d'un codage AI gratu

2026-04-28·3 мин

LLM·Habr AI

Comment une unique instruction système transforme un LLM en outil fiable : tests sur Qwen et DeepSeek

Un unique prompt système peut éliminer les hallucinations des LLM : une expérience avec Qwen et DeepSeek a montré qu'un 'exosquelette' de rè

2026-04-28·2 мин

LLM·Habr AI

T-Technologies sur l'open source en AI/ML : comment le travail avec les LLM est organisé en interne

Entretien avec l'équipe AI/ML du Groupe T-Technologies — sur le développement des LLM, la participation à l'open source et la direction de r

2026-04-28·1 мин

LLM·Habr AI

NVIDIA à la GTC 2026 change son focus des puces vers les usines de tokens et l'ère d'Agent-as-a-Service

À la GTC 2026, NVIDIA a présenté un pari non pas sur les GPU individuels, mais sur les usines de tokens, l'architecture modulaire Vera Rubin

2026-04-28·3 мин

LLM·Habr AI

PageIndex de VectifyAI propose une recherche sans embeddings pour les longs documents

PageIndex construit un index hiérarchique du document et recherche les sections pertinentes par raisonnement LLM, promettant la RAG sans emb

2026-04-28·2 мин

LLM·Habr AI

GolangConf 2026 et Ontiko : pourquoi les équipes Go doivent corriger l'architecture, pas la vitesse du code

Ontiko restructure GolangConf 2026 autour des vrais problèmes des équipes Go : l'IA a accéléré la rédaction de code, mais les décisions arch

2026-04-28·3 мин

LLM·Habr AI

ruGPT3XL Gagne un Contexte de 8k : le Modèle Restauré Dépasse la Limite de 2k avec des Pertes Minimales

L'auteur de la restauration de ruGPT3XL a corrigé sparse attention, augmenté le contexte du modèle de 2k à 8k et préservé la qualité sur les

2026-04-28·2 мин

LLM·Habr AI

OpenAI, MiniMax et Nvidia ont donné le ton de mars en IA : Sora, GPT-5.4 et le pari sur Mira Murati

Mars dans l'IA a été marqué par de grands changements de produits : OpenAI reconsidère l'avenir de Sora, Google et Anthropic accélèrent leur

2026-04-28·2 мин

LLM·Habr AI

Startups AI-first : pourquoi le growth marketing s'enlise et ce qui se casse dans l'entonnoir

Les produits AI-first ont souvent des métriques fortes en haut de l'entonnoir qui masquent une fausse demande : les gens viennent pour la no

2026-04-28·2 мин

LLM·Habr AI

Habr : Les agents IA transforment le delivery, et les équipes doivent reconstruire tout le cycle de développement

Habr explique pourquoi avec l'émergence des agents IA, les équipes doivent restructurer non seulement la rédaction de code mais tout le deli

2026-04-28·3 мин

LLM·Habr AI

M2 a confié 40% de ses textes marketing à un réseau neuronal et a préservé la qualité du contenu

L'équipe de M2 a intégré un rédacteur IA dans son département éditorial interne, délégué 40% de ses textes produits et marketing au modèle e

2026-04-28·2 мин

LLM·Habr AI

Sova AI a lancé un assistant Android qui contrôle le téléphone sans PC ni root

Sova AI a présenté une application Android avec un agent IA qui ouvre des applications, appuie sur les boutons, fait défiler les écrans et e

2026-04-28·2 мин

LLM·Habr AI

API OpenAI et Requêtes Fan-Out de GPT : Comment les Spécialistes SEO Analysent la Recherche par IA

L'auteur démontre comment récupérer les requêtes fan-out cachées de GPT via l'API OpenAI et les utiliser pour analyser comment les modèles d

2026-04-28·2 мин

LLM·Habr AI

Hack The Box : Comment MCP Inspector Transforme les Outils d'IA en un Nouveau Vecteur d'Attaque

Une analyse de Kobold du HTB Season 10 montre comment un seul utilitaire dev pour les serveurs d'IA peut conduire à RCE, LFI, réutilisation

2026-04-28·2 мин

LLM·Habr AI

Un système basé sur LLM a réduit la préparation des cartes de contrôle qualité en usine sidérurgique de 2 heures à 5 minutes

Dans une usine sidérurgique, un système LLM a commencé à assembler des cartes de contrôle qualité en 3–5 minutes au lieu de deux heures : no

2026-04-28·3 мин

LLM·Habr AI

Habr AI montre comment ajouter la mémoire et le contexte à un chat LLM en Python avec Ollama et LiteLLM

Dans une nouvelle partie du tutoriel sur le chat en Python avec Ollama et LiteLLM, l'auteur montre comment stocker l'historique des messages

2026-04-28·3 мин

LLM·Habr AI

Claude Sonnet et Jarvis Pattern : pourquoi les agents IA pourraient ne nécessiter qu'un système d'exploitation

Sur Habr, les développeurs ont proposé de construire des agents IA personnels non autour de frameworks complexes, mais sur une combinaison d

2026-04-28·2 мин

LLM·Habr AI

Yandex a montré comment accéder aux réponses d'Alice et mesurer la visibilité dans la recherche

Yandex a lancé une section 'Visibilité du Site dans Alice' dans Webmaster. Le message aux entreprises est clair : les réponses de l'assistan

2026-04-28·2 мин

LLM·Habr AI

Flant : comment un développeur Go a transformé Zed et Gemini en un agent IA utile

Un développeur Go de Flant a décrit le chemin qui va des plugins IDE lents à une combinaison de Zed, Gemini 3 Flash et gopls-mcp, qui fourni

2026-04-28·3 мин

LLM·Habr AI

Agentis Memory : Stockage Compatible Redis avec Recherche Vectorielle et Embeddings Locaux

Agentis Memory transforme un stockage compatible Redis en mémoire partagée pour les agents IA : avec embeddings locaux, recherche vectoriell

2026-04-28·3 мин

LLM·Habr AI

Habr : comment les données synthétiques aident à entraîner des modèles et pourquoi l'auto-entraînement conduit à l'effondrement

Les données synthétiques aident l'IA à compenser la pénurie de corpus de haute qualité générés par l'homme, mais avec un auto-entraînement i

2026-04-28·2 мин

LLM·Habr AI

Pourquoi ChatGPT et Gemini ne recommandent pas votre B2B SaaS, même si votre site est bien conçu

Même un site B2B SaaS bien conçu peut ne pas apparaître dans les réponses de ChatGPT, Gemini et Perplexity si votre marque manque d'une caté

2026-04-28·2 мин

LLM·Habr AI

Pourquoi l'IA en design d'interface est importante non pour la production, mais comme source de mutations visuelles

L'interface utilisateur générée par IA est précieuse non seulement pour la rapidité des croquis : sa force réside dans les combinaisons visu

2026-04-28·2 мин

LLM·Habr AI

Qwen et llama.cpp : comment exécuter un réseau neuronal local sans cloud sur votre ordinateur ou serveur

Un guide pratique expliquant comment exécuter le modèle Qwen via llama.cpp sur votre propre ordinateur ou serveur pour travailler avec un ré

2026-04-28·2 мин

LLM·Habr AI

Anthropic et Claude Cowork : 10 tâches professionnelles que l'IA retire aux humains

Claude Cowork d'Anthropic montre comment l'IA assume les briefings matinaux, les propositions, les réponses aux clients et les rapports, lib

2026-04-28·2 мин

LLM·Habr AI

Directum : pourquoi les entreprises discutent activement des agents IA mais hésitent à les déployer dans leurs processus

Directum explique pourquoi les agents IA sont devenus la principale tendance corporative, mais l'adoption de masse est entravée par une infr

2026-04-28·2 мин

LLM·Habr AI

ClawRouter a réduit les coûts des LLM API de 47 $ à 1,80 $ par semaine — examen du routeur intelligent

ClawRouter analyse chaque requête selon 15 paramètres et l'achemine vers le modèle le plus approprié et économique — réduisant les dépenses

2026-04-28·2 мин