Kimi K2.5 : Moonshot AI construit une armée d'agents pour des kopecks
Nous sommes habitués à ce que chaque nouveau modèle de l'industrie soit simplement un peu plus de paramètres, un peu moins d'hallucinations et des débats…
Traité par IA depuis Habr AI ; édité par Hamidun News
Nous sommes habitués à ce que chaque nouveau modèle de l'industrie soit simplement un peu plus de paramètres, un peu moins d'hallucinations et des débats infinis sur les benchmarks. Mais Moonshot AI avec la sortie de Kimi K2.5 a décidé de changer la conversation.
Tandis que tout le monde essaie de construire une « tête la plus intelligente », les Chinois ont créé un système qui peut efficacement utiliser une douzaine de mains à la fois. Le principal problème avec les agents IA modernes n'est pas qu'ils sont stupides, c'est qu'ils sont lents. Si vous demandez à un réseau de neurones d'écrire du code, de le tester et de créer de la documentation, il le fait séquentiellement.
Vous restez assis et attendez que le curseur se déplace lentement sur l'écran. Kimi K2.5 casse ce paradigme grâce à une capacité inhérente de décomposition et d'exécution parallèle.
Le graphique que les développeurs ont inclus avec la sortie mérite une attention particulière. Sur l'axe X — la complexité de la tâche, sur l'axe Y — le temps. Alors qu'un agent unique ordinaire dépense proportionnellement plus de temps à mesure que les tâches deviennent plus complexes, K2.
5 en mode essaim maintient une ligne presque horizontale. Sur les projets vraiment lourds, l'écart de vitesse atteint quatre fois et demie. Ce n'est pas juste un bonus agréable, c'est un changement fondamental dans la façon dont nous utiliserons l'IA au travail.
Au lieu d'attendre une réponse d'un « monsieur je-sais-tout », nous obtenons une équipe coordonnée qui attaque la tâche de tous les côtés simultanément. De plus, Moonshot AI affirme qu'elle a enseigné au modèle cette logique au niveau architectural, pas seulement en écrivant des scripts externes pour diviser les tâches.
Ce qui est également intéressant, c'est la façon dont Moonshot positionne son nouveau produit. Ils annoncent une solution open-source puissante, ce qui est en soi rare pour les entreprises de ce niveau en Chine. Mais le prix est encore plus important.
L'accès à cette magie d'essaim coûte à peu près le même que ce que nous payons pour ChatGPT ordinaire. Cela rend la technologie d'essaim accessible non seulement aux géants corporatifs avec des budgets sans limites, mais aussi aux développeurs ordinaires. Nous entrons dans une phase où le coût du travail intellectuel commence à approcher zéro non seulement en termes de qualité, mais aussi en termes de temps.
Si auparavant un agent pouvait « réfléchir » à une recherche complexe pendant dix minutes, maintenant il livrera les résultats en deux. Cela change complètement l'expérience utilisateur.
Bien sûr, la question se pose : et la qualité ? Généralement, l'exécution parallèle souffre de la cohérence. Si une partie de l'essaim ne sait pas ce que fait l'autre, vous obtenez un Frankenstein en résultat.
Cependant, Moonshot AI affirme que son mécanisme de décomposition fonctionne en tenant compte du contexte de l'ensemble de la tâche. C'est une continuation logique de leurs succès antérieurs — rappelez-vous que cette équipe a été la première à nous habituer à l'idée que les fenêtres de contexte pourraient être véritablement énormes. Maintenant, ils ont combiné la capacité de « tout mémoriser » avec la capacité de « tout faire à la fois ».
Pour l'industrie, cela signifie que la course aux paramètres cède temporairement la place à la course à l'efficacité de l'inférence.
Qu'est-ce que cela signifie pour nous ? Très probablement, au cours des six prochains mois, nous verrons des mouvements similaires de OpenAI et Anthropic. Les rumeurs sur leurs projets d'agents circulent depuis longtemps, mais les Chinois ont été les premiers à démontrer un modèle économique et technique fonctionnel de cette envergure. Si vous utilisez encore les réseaux de neurones simplement comme outil de recherche avancée ou éditeur de texte, préparez-vous — bientôt, elles deviendront des départements virtuels à part entière, où une seule demande lance le fonctionnement d'une chaîne de montage entière. Et à en juger par Kimi K2.5, cette chaîne de montage fonctionnera terriblement vite.
L'essentiel: Moonshot AI a prouvé que l'avenir ne dépend pas d'un seul modèle super puissant, mais de la capacité des réseaux de neurones à travailler en équipe. Les entreprises occidentales pourraient-elles offrir quelque chose d'aussi rapide et bon marché dans un proche avenir ?
Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?
AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.