MarkTechPost→ original

StepFun présente Step 3.7 Flash — un modèle Vision-Language de 198 milliards de paramètres

StepFun a lancé Step 3.7 Flash, un modèle Vision-Language de 198 milliards de paramètres reposant sur une architecture mixture-of-experts. Le modèle dispose de

StepFun présente Step 3.7 Flash — un modèle Vision-Language de 198 milliards de paramètres
Source : MarkTechPost. Collage: Hamidun News.
◐ Écouter l'article

StepFun a officiellement présenté Step 3.7 Flash — un nouveau modèle Vision-Language qui promet d'être une solution significative pour les tâches spécialisées en intelligence artificielle. Ce modèle est construit sur une architecture de Mélange d'Experts (MoE) et contient 198 milliards de paramètres, ce qui lui permet de fournir des performances élevées tout en utilisant efficacement les ressources informatiques.

Paramètres Techniques et Architecture

Step 3.7 Flash se distingue par plusieurs caractéristiques techniques clés. Le modèle utilise une architecture MoE dans laquelle seuls les sous-réseaux de paramètres pertinents sont activés pour chaque exemple d'entrée.

Cela permet d'atteindre un équilibre entre l'échelle du modèle et l'efficacité de son fonctionnement. Les capacités visuelles intégrées permettent au modèle de traiter non seulement des données textuelles, mais aussi d'analyser des images. Une fenêtre de contexte élargie de 256 mille tokens permet de travailler avec de longs documents, des bases de code complexes et des matériaux visuels détaillés sans perte de contexte.

Une place particulière est occupée par le mode Advisor, intégré dans l'architecture du modèle. Ce mode fournit un niveau supplémentaire de contrôle sur le comportement du modèle et permet une sortie plus structurée et prévisible. Une telle approche est particulièrement utile dans les environnements de production où la fiabilité et la cohérence des résultats sont requises.

Applications Cibles et Scénarios d'Utilisation

StepFun positionne Step 3.7 Flash comme une solution pour deux domaines d'application principaux. Le premier est l'automatisation du développement de code.

Le modèle peut analyser le code source, identifier les améliorations potentielles, générer des versions optimisées et même participer au processus de débogage. La vision intégrée lui permet de travailler avec des captures d'écran de code et des diagrammes d'architecture. Le second domaine est l'intégration dans les systèmes de recherche.

Les capacités visuelles rendent le modèle approprié pour les plates-formes de recherche qui fonctionnent avec à la fois des requêtes textuelles et des images. Le contexte élargi permet de rechercher des réponses complexes et multifacettes basées sur des données complètes. De plus, le modèle peut être appliqué dans les outils analytiques — pour traiter les ensembles de données combinés, analyser les matériaux vidéo avec une transcription détaillée du contenu et fournir des recommandations structurées basées sur les résultats obtenus.

Position sur le Marché

Le lancement de Step 3.7 Flash continue une tendance visible sur le marché vers la spécialisation. Au lieu de créer des modèles universels, les entreprises développent de plus en plus des solutions optimisées pour des tâches spécifiques. StepFun démontre que la spécialisation efficace est réalisée non seulement par le choix de l'architecture, mais aussi par des modes de fonctionnement spéciaux qui permettent d'adapter le comportement du modèle aux exigences spécifiques. L'architecture MoE devient le standard pour les grands modèles, particulièrement dans le contexte des limitations de consommation d'énergie et des coûts d'infrastructure. Cela ouvre la voie à des solutions d'IA plus accessibles et écologiques.

Ce Que Cela Signifie

L'émergence de Step 3.7 Flash indique un changement important dans la stratégie de développement des grands modèles. Au lieu d'une course à la taille et à l'universalité, les développeurs se concentrent sur l'optimisation profonde pour des applications spécifiques. Pour les développeurs et les entreprises, cela signifie plus d'outils à choisir et la possibilité de sélectionner une solution qui correspond parfaitement aux besoins de leur projet. L'architecture MoE, à son tour, devient non seulement une astuce d'ingénierie mais un standard pour les modèles efficaces de prochaine génération. Cela permet de réduire les coûts d'infrastructure et les dépenses opérationnelles sans compromettre la qualité, ce qui est critique pour la mise en œuvre commerciale de l'IA.

ZK
Hamidun News
Actualités IA sans bruit. Sélection éditoriale quotidienne de plus de 400 sources. Produit de Zhemal Khamidun, Head of AI chez Alpina Digital.

Хотите не читать про ИИ, а внедрить его?

«AI News» — это полезные новости из мира ИИ. Системно научиться работать с нейросетями и применять их в работе — в Hamidun Academy.

Qu'en pensez-vous ?
Chargement des commentaires…