апрель 2026 г.

Elon Musk promet de restructurer xAI après une nouvelle vague de départs parmi les cofondateurs
Elon Musk a déclaré qu'il allait restructurer xAI après une série de départs de l'entreprise : les turbulences au sein des effectifs ont acc

Claude Cowork et Chrome : 10 cas d’usage pour déléguer la routine répétitive du navigateur à un agent AI
Habr a publié une analyse pratique de la manière dont Claude Cowork, associé à une extension Chrome, prend en charge la recherche de données

Microsoft et NVIDIA présentent le physical AI comme le prochain avantage pour l'industrie
MIT Technology Review décrit une nouvelle étape de l'automatisation : le physical AI aide les usines non seulement à réduire leurs coûts, ma

Anthropic a expliqué comment les entreprises peuvent mettre en place des systèmes agentiques sans complexité inutile
Anthropic a montré qu'il est plus avantageux pour les entreprises de commencer non pas par des systèmes agentiques autonomes, mais par des s

En cinq jours, Yoyo est passé de 200 lignes à un agent autonome qui écrit du code tout seul
Une expérience avec l’agent Yoyo a montré que 200 lignes en Rust suffisaient à lancer une boucle d’auto-accélération : le bot lit son propre

ChatGPT et les data centers : comment la croissance de l’AI accélère la consommation d’énergie et la pression sur l’eau
La croissance de ChatGPT et d’autres services d’AI stimule la construction de data centers, augmentant la demande en électricité et en eau,

GLiNER 2 a montré comment les encodeurs compacts rattrapent les LLM en NER et en classification
Une nouvelle vague d’encodeurs zero-shot, menée par GLiNER 2, montre que les tâches de NER et de classification peuvent être traitées sans L

NVIDIA présente NeMo Retriever — recherche agentique pour des données d'entreprise complexes
NVIDIA a présenté un pipeline agentique dans NeMo Retriever : le système ne se limite pas à la recherche sémantique, il planifie des étapes,

Ollama Cloud comparé en code review : DeepSeek v3.1 s’est révélée supérieure à Qwen et GPT-OSS
L’auteur a testé trois modèles dans Ollama Cloud sur de vraies Pull Requests Python d’un projet legacy : DeepSeek v3.1 a offert le meilleur

CodeSpeak, d’Andrey Breslav, créateur de Kotlin, déplace le développement du code vers les spécifications
L’équipe d’Andrey Breslav a lancé l’alpha publique de CodeSpeak — une plateforme où le développeur décrit un système en anglais, tandis que

OpenAI, SoftBank et Oracle s’opposent sur Stargate : le mégaprojet de data centers s’enlise
Stargate, un projet pouvant atteindre 500 milliards de dollars conçu comme la base de calcul d’OpenAI, ralentit : les partenaires s’opposent

AWS et vLLM ont intégré P-EAGLE pour accélérer l’inférence des LLM de grande taille jusqu’à 1,69×
AWS a montré comment P-EAGLE dans vLLM supprime le goulet d’étranglement du décodage spéculatif, génère plusieurs tokens en un seul passage

Elon Musk remanie xAI: suppressions de postes, consultants de Tesla et SpaceX et pari sur les centres de données AI
Musk a lancé une restructuration musclée de xAI : après l'afflux d'argent de Tesla et le rapprochement avec SpaceX, des consultants externes

Harry Tan a lancé gstack — un système de workflow pour Claude Code avec QA, revue et release
Harry Tan a publié gstack en open source — un ensemble de modes pour Claude Code qui sépare la planification, la revue, le QA et le release

Les États-Unis renoncent à lier la vente de puces AI à la construction obligatoire de centres de données
Washington n’a pas soutenu l’idée de vendre des accélérateurs américains uniquement aux pays et aux entreprises prêts à construire des centr

Google a profondément mis à jour Maps : Gemini répond aux questions et la navigation est désormais en 3D
Google a déployé la plus importante mise à jour de Maps depuis dix ans : Ask Maps, basé sur Gemini, comprend des requêtes complexes du quoti

Claude comme partie de la pensée : pourquoi perdre un outil d'AI perturbe non seulement l'accès, mais aussi le travail
Pour les utilisateurs actifs, perdre un compte Claude s'est révélé être plus qu'une simple panne de service : avec l'accès disparaissent aus

Seldon Vault a transformé la psychohistoire d'Asimov en un service multi-agents de prévisions par AI
Seldon Vault transforme l'idée de la psychohistoire d'Asimov en un véritable service AI : sept agents, un sceptique et un arbitre élaborent

The Lancet Psychiatry avertit : les chatbots avec AI peuvent renforcer les idées délirantes chez les personnes vulnérables
Une revue publiée dans The Lancet Psychiatry a montré que les chatbots avec AI peuvent renforcer les idées délirantes chez les personnes vul

Elon Musk remanie encore xAI : départ de cofondateurs, suppressions de postes et Grok en retard
xAI traverse un nouveau redémarrage brutal : des ingénieurs clés et des cofondateurs quittent l'entreprise, Grok est distancé par ses concur

Anthropic et ETH Zurich : un CLAUDE.md trop long dégrade les performances de l'agent et augmente les coûts
Une étude d'ETH Zurich portant sur 138 dépôts montre que des fichiers CLAUDE.md et AGENTS.md trop longs réduisent souvent le taux de réussit

Gemini 3.1 Pro a surpassé ChatGPT 5.4 et Claude Opus 4.6 dans un test de génération de texte
Une comparaison menée par l’auteur entre trois modèles de premier plan sur quatre exercices littéraires a montré que Gemini 3.1 Pro maîtrise

Anthropic, OpenAI et Cursor : huit niveaux de maturité de l’ingénierie des agents
Habr AI a analysé huit niveaux de l’ingénierie des agents, du tab-complete et du context engineering aux background agents et aux équipes au

Zhipu AI lance GLM-OCR, un modèle OCR compact de 0,9 milliard de paramètres pour les documents
Zhipu AI et l'université Tsinghua ont présenté GLM-OCR, un modèle OCR multimodal de 0,9 milliard de paramètres capable d'analyser des docume

LangChain a publié Deep Agents pour des agents AI multi-étapes avec mémoire et isolation
LangChain a publié Deep Agents, une bibliothèque pour des agents AI qui ont besoin de planification, de mémoire à long terme, de contexte de

AMD RX580 a fait tourner un LLM en local : comment venir à bout de ROCm, d'Ollama et obtenir une inférence sur GPU
Un ingénieur a montré comment faire tourner de façon stable un LLM sur une ancienne AMD RX580 via ROCm et Ollama, en détaillant les faux sig

Pourquoi Claude 4.6 ne suffit pas sans contexte : le principal angle mort du développement avec les LLM
Même un modèle solide comme Claude 4.6 perd en efficacité sans un contexte réuni de manière systématique : knowledge base, liens entre servi

AI pousse les universités à repenser les travaux universitaires : le problème de la triche est antérieur à ChatGPT
La Dre Nafisa Baba-Ahmed estime que l'AI n'a pas créé la crise des travaux universitaires, mais a seulement amplifié une vieille habitude co

Un développeur crée un agrégateur d'actualités avec AI, MCP, DeepSeek et un bot Telegram
Après l'attaque de drones au-dessus de Dubaï, un développeur a créé un agrégateur d'actualités multilingue : 80+ sources, un serveur MCP pou

BorisovAI a testé MoE sur une RTX 4090 et a montré pourquoi la perplexité fausse l’évaluation des LLM
BorisovAI a testé MoE avec des experts plug-in sur une seule RTX 4090 et a constaté qu’une perplexité flatteuse ne garantit pas un vrai gain

Une expérience avec un LLM a montré comment la « personnalité » du modèle émerge dans l’espace latent
Une expérience avec un LLM modulaire a montré qu’un vecteur latent distinct peut stocker non seulement le style du texte, mais aussi des tra

Nvidia laisse entrevoir, avant la GTC 2026, une puce optique capable de redessiner les centres de données AI
Avant sa prise de parole du 16 mars 2026, Nvidia a alimenté les attentes du marché avec la promesse d’« une puce qui va secouer le monde »,

Pourquoi les avancées de DeepMind en AGI ne répondent pas à la question centrale de la conscience machinique
L'auteur explique pourquoi l'augmentation de la puissance de calcul et les avancées de DeepMind en AGI ne signifient pas l'émergence de la c

IBM a lancé Granite 4.0 1B Speech — un modèle vocal multilingue compact pour l'edge AI
IBM a présenté Granite 4.0 1B Speech, un modèle léger de reconnaissance et de traduction de la parole conçu pour un déploiement rapide dans

Les suppressions de postes chez Atlassian ont relancé le débat : l’AI doit-elle réduire le temps de travail plutôt que les effectifs ?
Après les licenciements chez Atlassian, les économistes débattent de nouveau de la répartition des gains de l’AI : aux entreprises sous form

OpenAI a reporté le lancement des chats érotiques dans ChatGPT en raison des risques pour les adolescents
OpenAI a de nouveau reporté les chats érotiques dans ChatGPT : l'entreprise a été freinée par un contrôle d'âge insuffisant, le risque d'acc

Habr AI sur l’avenir du travail : comment AI et les robots pourraient ramener la société à une nouvelle Antiquité
Habr AI estime que l’association de AI, de la robotisation et des neuroimplants pourrait non seulement transformer le marché du travail, mai

Le bénéfice de Hon Hai, partenaire de Nvidia, recule et renforce les inquiétudes autour de la demande de serveurs AI
Hon Hai, l’un des principaux partenaires de Nvidia dans le matériel pour serveurs, a fait état d’une baisse de 2,4% de son bénéfice trimestr

Google retire de la recherche une fonction AI affichant des conseils médicaux d'utilisateurs quelconques
Google a mis fin à la fonction What People Suggest dans la recherche : l'outil AI affichait des conseils médicaux de personnes ordinaires et

Unity a montré comment créer des PNJ vocaux avec mémoire et contexte du monde
Un guide pas à pas montre comment créer dans Unity des PNJ vocaux avec un modèle local, une mémoire des dialogues, une connaissance du monde

Harvard : AI réduit les recrutements de juniors, et dans trois ans cela pourrait toucher tout le secteur
Harvard constate une baisse des recrutements de juniors après l’adoption d’AI, tandis que METR pointe une dépendance croissante des développ

Moonshot AI a présenté Attention Residuals — une alternative aux connexions résiduelles dans les transformers
Moonshot AI a proposé Attention Residuals, un remplacement des connexions résiduelles standard dans les transformers, où la couche sélection

DeepSeek et GLM-5 ont dépassé Yandex dans un test de 34 modèles d’AI pour managers sans VPN
Les auteurs d’un vaste test de scénarios managériaux ont constaté que DeepSeek V3.2 et GLM-5, accessibles en Russie sans VPN, sont nettement

Google a lancé Gemini Embedding 2 pour le RAG multimodal avec vidéo, audio et PDF
Google a lancé Gemini Embedding 2, un modèle qui vectorise le texte, les images, la vidéo, l’audio et les PDF dans un espace unique et simpl

Bitrix24 a recensé huit erreurs typiques dans le développement de serveurs MCP pour les LLM
Un développeur de Bitrix24 a expliqué pourquoi les serveurs MCP échouent sur l’autorisation, les chaînes d’appels, les mauvaises description

Le Pr Dionne présentera VINPix — nanophotonique et AI pour la multiomique sur puce
IEEE Spectrum invite à un webinaire sur la plateforme VINPix : des puces nanophotoniques associées à AI promettent d’accélérer l’analyse mul

Pourquoi l'idée de world model de Yann LeCun ne résout pas la principale crise du développement des LLM
Après le départ de Yann LeCun de Meta, son concept de world model est de nouveau discuté comme une voie au-delà des LLM, mais les critiques

Alibaba regroupe ses services d'AI dans une nouvelle division pour soutenir la croissance des bénéfices
Alibaba crée une division distincte qui réunira les services et les efforts de développement d'AI aujourd'hui dispersés dans l'entreprise af

Un pipeline de Physical AI pour le SO-101 a été assemblé sur la base de ROS2 et LeRobot pour 30 000 roubles
Une stack open source basée sur ROS2 et LeRobot permet de construire un pipeline complet de Physical AI sur le SO-101 à bas coût : téléopéra

Citrini Research : comment AI peut faire s'effondrer la prime à l'intelligence et secouer l'économie
Citrini Research décrit un scénario dans lequel AI transforme le travail intellectuel en produit de masse, fait pression sur les salaires de

xAI recrute des banquiers et des experts du crédit pour renforcer Grok dans la finance
xAI veut former Grok à la stratégie financière avec l'aide de banquiers et de spécialistes du private credit, en misant sur un segment plus

Karakeep aide à mettre de l'ordre dans les articles, les liens et les onglets YouTube avec AI
Karakeep transforme le chaos des articles, des recherches et des onglets YouTube en une archive bien rangée : AI ajoute automatiquement des

Intel avertit : l’AI agentique a dépassé son stade d’"enfance" et exige un nouveau modèle de contrôle
L’AI agentique passe des chatbots aux actions autonomes, et les entreprises ont désormais besoin non pas de politiques générales, mais de ga

SimpleOne a lancé SimpleGen — un outil AI pour le développement et le déploiement sur la plateforme
SimpleOne a présenté SimpleGen — un outil AI de génération de solutions sur sa plateforme : le développeur n'a qu'à préparer un dépôt, un ac

Google AI Ultra : comment transformer un abonnement en pool d'agents parallèles et en consensus entre modèles
Google AI Ultra est proposé comme base d'une stack multi-agents : lancer des workers Gemini en parallèle, déléguer les tâches routinières et

La plainte de Musk contre OpenAI et Microsoft va se poursuivre, même si le montant de 134 milliards de dollars a été jugé arbitraire
La juge a mis en doute l'estimation des dommages dans la plainte d'Elon Musk contre OpenAI et Microsoft, pouvant aller jusqu'à 134 milliards

Meta dépensera jusqu'à 27 milliards de dollars pour l'infrastructure AI de Nebius Group au cours des cinq prochaines années
Meta est prête à dépenser jusqu'à 27 milliards de dollars sur cinq ans pour accéder à l'infrastructure AI de Nebius Group, ce qui montre que

Britannica et Merriam-Webster poursuivent OpenAI pour près de 100 000 articles
Britannica et Merriam-Webster accusent OpenAI d'avoir utilisé leurs contenus pour entraîner ChatGPT sans autorisation et d'avoir restitué de

Le conseiller en startups AI Salil Darji a pointé les erreurs que les fondateurs voient trop tard
Le mentor de startups AI Salil Darji estime que les fondateurs sont freinés par la dispersion, le culte du pitch deck et la course au hype —

OpenAI pourrait entrer dans les systèmes militaires américains contre l'Iran — du choix des cibles à la défense contre les drones
Après l'accord avec le Pentagone, les technologies d'OpenAI pourraient apparaître dans le conflit autour de l'Iran — de la priorisation des