Mistral AI News→ original

Mistral Medium 3.5 : agents cloud et nouveau mode Work pour les tâches complexes

Mistral AI a lancé Medium 3.5, un modèle 128B puissant avec un contexte de 256k pour le codage et l'analyse. Les nouveaux agents asynchrones du cloud dans…

Traité par IA depuis Mistral AI News ; édité par Hamidun News
Mistral Medium 3.5 : agents cloud et nouveau mode Work pour les tâches complexes
Source : Mistral AI News. Collage: Hamidun News.
◐ Écouter l'article

Mistral AI a lancé Mistral Medium 3.5, un nouveau modèle 128B qui combine les capacités d'instruction, de raisonnement et de codage. La grande nouveauté : les agents de codage se déplacent vers le cloud et fonctionnent désormais de manière asynchrone, en parallèle, notifiant le développeur quand ils terminent la tâche.

Mistral

Medium 3.5 : un modèle pour les tâches longues Mistral Medium 3.5 est le premier modèle fusionné de la gamme Mistral, où toutes les capacités se trouvent dans un seul ensemble de poids au lieu d'utiliser différents modèles pour différentes tâches.

Avec une taille de 128B et une fenêtre de contexte de 256k, il peut s'exécuter sur quatre GPU, ce qui rend l'auto-hébergement pratique et économique. Les performances sont impressionnantes. Sur les tests SWE-Bench Verified, le modèle obtient 77,6 % — plus que Devstral 2.

Pour les tâches d'agent, où le modèle doit appeler des outils et résoudre des problèmes multi-étapes, le score est 91,4 sur τ³-Telecom. Cela signifie que Medium 3.5 fonctionne de manière fiable dans les longues sessions avec plusieurs outils et produit une sortie structurée que d'autres programmes peuvent traiter.

Le paramètre reasoning effort est maintenant configurable par requête. Le même modèle peut répondre à une requête de chat rapide en millisecondes ou passer plus de temps sur un cycle d'agent complexe avec un raisonnement multi-étapes. C'est une flexibilité qui n'existait pas auparavant.

Agents cloud dans

Vibe : asynchrone et parallèle Auparavant, les agents de codage fonctionnaient localement sur l'ordinateur portable du développeur. Cela signifiait que le développeur devait rester à l'écran, surveiller chaque étape et approuver les actions. Maintenant, les agents se déplacent vers le cloud et fonctionnent de manière asynchrone, en parallèle, indépendamment de l'endroit où se trouve le développeur.

Il y a deux façons de lancer un agent cloud. La première est via la CLI Mistral Vibe : vous écrivez une commande et la session se lève dans le cloud, fonctionne de manière autonome. La deuxième façon est directement depuis Le Chat : écrivez une tâche dans le chat, et l'agent comprendra le contexte et commencera à travailler.

Il y a aussi une troisième option : si vous avez commencé le travail localement dans la CLI et décidé de partir, vous pouvez téléporter la session vers le cloud. Tout l'historique de la conversation, l'état de la tâche et les approbations effectuées sont emportés avec vous — la continuation du travail sera transparente. Chaque session fonctionne dans un sandbox isolé et a accès aux outils nécessaires pour le travail spécifique.

GitHub (code et pull-requests), Linear et Jira (gestion des tâches), Sentry (surveillance des incidents), Slack et Teams (alertes et communication). Lorsque le travail est terminé, l'agent ouvre automatiquement une pull-request. Vous ne faites que vérifier le résultat au lieu de surveiller chaque étape.

Mode

Work dans Le Chat pour les tâches complexes Le nouveau mode Work dans Le Chat lance un agent spécialisé (alimenté par Medium 3.5) qui décompose les tâches complexes multi-étapes. Cela inclut la recherche, l'analyse de données, les actions cross-outils avec plusieurs intégrations simultanément.

L'agent appelle les outils en parallèle et travaille jusqu'à l'achèvement complet de la tâche. Le système cible le travail de haut volume et bien défini qui prend du temps au développeur mais ne nécessite pas son jugement à chaque étape : Refactorisation de grands modules Génération de tests pour le code existant Mise à jour et correction des dépendances Analyse des problèmes CI et des journaux * Correction des bogues connus C'est du travail de routine où la précision et l'attention sont nécessaires, mais pas la créativité.

Ce que cela signifie

Les agents de codage cloud passent des laboratoires et des expériences à la production. Pour les équipes d'ingénierie, cela signifie qu'on peut enfin déléguer des tâches volumineuses et bien définies (refactorisations, tests, mises à jour) et obtenir une pull-request prête à être examinée. Le développeur ne passe pas des heures sur du travail mécanique, mais peut se concentrer sur ce qui nécessite son jugement et sa créativité.

ZK
Hamidun News
Actualités IA sans bruit. Sélection éditoriale quotidienne de plus de 400 sources. Produit de Zhemal Khamidun, Head of AI chez Alpina Digital.

Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?

AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.

Qu'en pensez-vous ?
Chargement des commentaires…