LangChain a mis à jour LangSmith : copilote d’astreinte pour le triage des alertes, débogage vocal et Deep Agents Rubrics
LangChain a publié son récapitulatif de juin avec d’importantes mises à jour de LangSmith. La principale est un copilote d’astreinte pour le triage des…
Traité par IA depuis LangChain Blog ; édité par Hamidun News
LangChain a publié son résumé de juin, qui inclut les mises à jour clés de la plateforme LangSmith, un nouveau système d'évaluation des agents appelé Deep Agents Rubrics, un cours éducatif sur le déploiement et des annonces d'événements en personne pour le second semestre.
Copilote de Garde pour les Alertes
La mise à jour centrale de LangSmith en juin est le copilote de garde Fleet, un outil de triage rapide des alertes dans les systèmes d'agents. L'objectif de l'outil est d'aider l'ingénieur de garde à arriver rapidement à la racine d'un incident : il recueille le contexte des traces, analyse les modèles d'erreurs et suggère la cause la plus probable de la défaillance sans avoir besoin d'examiner manuellement des centaines de lignes de journaux. Ce problème est bien connu de toute équipe exécutant des agents en production : plus un système d'agents est complexe, plus il est difficile de comprendre exactement où quelque chose s'est mal passé.
Une erreur pourrait s'être produite dans le prompt, dans un outil, dans le mécanisme de mémoire à long terme ou dans la logique d'orchestration de plusieurs agents simultanément. Le copilote de garde Fleet rétrécit l'espace de recherche et réduit le temps entre la première alerte et la compréhension de sa cause.
Nouvelles Fonctionnalités pour les Développeurs
En plus du copilote de garde, LangSmith a reçu quatre ajouts pratiques :
- Computer use pour les agents — les agents peuvent maintenant interagir directement avec l'interface informatique : cliquer sur des boutons, remplir des champs de formulaire, lire le contenu de l'écran en temps réel
- Débogage vocal des traces — les développeurs peuvent rejouer les interactions vocales directement dans l'interface LangSmith et voir clairement où l'agent a fait une erreur dans l'interprétation de la parole
- Suivi du statut des expériences — un nouveau tableau de bord affiche la progression des exécutions de test longues sans avoir besoin de vérifier manuellement chaque exécution
- Sous-agents programmatiques — la capacité d'exécuter des chaînes d'agents imbriquées directement à partir du code sans configuration manuelle de la couche d'orchestration
Toutes les quatre mises à jour répondent à des besoins d'ingénierie spécifiques et ont émergé de demandes d'équipes qui exploitent déjà des systèmes d'agents en production réelle, pas seulement des prototypes.
Deep Agents Rubrics et Formation
LangChain a annoncé Deep Agents Rubrics — un système de critères structurés pour évaluer les agents complexes multi-étapes. Cela répond à un problème de longue date de l'industrie : comment mesurer objectivement la qualité d'un agent qui résout une tâche non-linéaire en plusieurs étapes ? Les métriques simples comme 'succès/échec' ne suffisent pas ici.
Les rúbriques offrent un moyen de décomposer les scénarios complexes en sous-tâches évaluables et d'attribuer des scores pour chacune. Ceci est particulièrement utile lors de la comparaison de différentes versions d'un agent ou lors du choix entre des approches architecturales — par exemple, entre un unique grand agent orchestrateur et plusieurs agents exécuteurs spécialisés. L'évaluation structurée aide à prendre des décisions d'ingénierie basées sur des preuves plutôt que de se fier à la sensation subjective que 'cela semble fonctionner mieux'.
Un nouveau cours sur le déploiement de LangSmith a été lancé pour ceux qui souhaitent passer du premier prototype au déploiement complet en production. Des événements en personne à Chicago, Berlin, Washington et Las Vegas sont prévus pour le second semestre 2026.
Ce Que Cela Signifie
Les mises à jour de juin de LangSmith reflètent un changement important : le centre de gravité de l'industrie se déplace du développement d'agents à leur exploitation fiable. Le copilote de garde, le traçage vocal et les rúbriques d'évaluation ne sont plus des outils de prototypage, mais une infrastructure opérationnelle pour les équipes exécutant des agents en production réelle. Les agents IA passent de la phase expérimentale à la phase de discipline d'ingénierie.
Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?
AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.
L'essentiel de l'IA — une fois par semaine
Sept actus qui ont vraiment compté, choisies à la main. Sans bruit ni communiqués.
C'est fait ! Vérifiez votre boîte mail pour la confirmation.