MarkTechPost→ original

Cohere lance Command A+ : 218 milliards de paramètres pour agents sur deux GPUs

Cohere a lancé Command A+, un modèle ouvert avec 218 milliards de paramètres pour les flux de travail d'agents. Avec la quantification W4A4, il fonctionne sur d

Cohere lance Command A+ : 218 milliards de paramètres pour agents sur deux GPUs
Source : MarkTechPost. Collage: Hamidun News.
◐ Écouter l'article

Cohere a lancé Command A+ — un modèle open source de nouvelle génération pour les flux de travail d'agents. Il s'agit de 218 milliards de paramètres dans une architecture Sparse Mixture-of-Experts, combinant quatre variantes précédentes de Command A en une solution universelle.

Une puissance énorme dans un facteur de forme compact

Le principal accomplissement est l'efficacité sans perte de qualité. Grâce à la quantification W4A4 (enregistrement 4 bits des poids et des activations), le modèle s'exécute sur deux GPU H100. Les modèles concurrents avec 300+ milliards de paramètres nécessitent huit à seize cartes graphiques.

Cela réduit le coût de déploiement d'environ quatre fois. Le support de 48 langues, y compris le russe, le chinois et l'arabe, rend Command A+ véritablement mondial. Pour les entreprises construisant des agents pour les marchés internationaux, c'est critique.

Mais le plus intéressant, c'est que c'est le premier modèle de raisonnement multimodal de Cohere. Il fonctionne avec du texte, des vidéos et des images simultanément, élargissant la gamme de tâches du traitement des enregistrements de réunions à l'analyse de captures d'écran et de diagrammes.

À qui cela est utile

Le code open source est un avantage clé. Les développeurs peuvent désormais déployer Command A+ sur leurs propres serveurs sans dépendance au cloud. Pour les startups et les entreprises ayant des données confidentielles (fintech, healthcare), c'est critique.

  • Configuration minimale : deux H100 au lieu de seize
  • Multimodalité dans un modèle (texte, vidéo, images)
  • Support de 48 langues pour les marchés mondiaux
  • Optimisation Sparse MoE : seulement 37B paramètres fonctionnent simultanément
  • Cycle de vie simplifié : quatre modèles en sont devenus un

C'est particulièrement important pour les agents qui nécessitent des mises à jour fréquentes et une adaptation à des processus spécifiques. Lorsque le modèle s'exécute localement, le cycle de développement s'accélère.

Contexte de la concurrence

Command A a été précédemment lancé en quatre variantes différentes — pour la recherche, le chat, le codage et l'analyse. Combiner en un modèle multimodal simplifie l'écosystème face à la concurrence féroce avec OpenAI, Anthropic et d'autres leaders. Cohere propose aux entreprises une base puissante open source avec laquelle les chercheurs, les startups et les clients d'entreprise peuvent travailler.

Ce que cela signifie

Les grands modèles ouverts deviennent plus compétitifs avec les modèles propriétaires. Quand 218 milliards de paramètres s'exécutent sur deux cartes graphiques au lieu d'un cluster de centaines de GPU, la barrière à l'entrée chute considérablement. Pour les entreprises construisant leurs propres agents, cela signifie plus de contrôle, des coûts réduits et un cycle de mise à jour plus rapide.

ZK
Hamidun News
Actualités IA sans bruit. Sélection éditoriale quotidienne de plus de 400 sources. Produit de Zhemal Khamidun, Head of AI chez Alpina Digital.
Qu'en pensez-vous ?
Chargement des commentaires…