Alibaba prépare le lancement du nouveau modèle Qwen 3.5
Dans le monde de l'intelligence artificielle, des changements importants arrivent : selon 36氪, Alibaba se prépare à lancer une nouvelle version de son modèle…
Traité par IA depuis 36Kr (36氪) ; édité par Hamidun News
Dans le monde de l'intelligence artificielle, des changements importants arrivent : selon 36氪, Alibaba se prépare à lancer une nouvelle version de son modèle de base Qwen, appelée Qwen 3.5. La preuve en est l'apparition d'une demande d'inclusion de Qwen 3.5 dans la bibliothèque Transformers sur la plateforme HuggingFace, la plus grande communauté d'IA open-source au monde. Ce mouvement signale un lancement imminent et génère un intérêt considérable dans l'industrie.
Qu'est-ce que Qwen et pourquoi est-ce important ? Qwen est une famille de grands modèles de langage (LLM) développée par Alibaba Group. Ces modèles, comme d'autres LLMs, sont capables de générer du texte, de traduire des langues, d'écrire divers types de contenu créatif et de répondre à vos questions de manière informative. Ils sont les piliers de nombreuses applications modernes d'IA, des chatbots aux systèmes de génération automatique de contenu. La mise à niveau vers la version 3.5 signifie des améliorations significatives en termes de performance, d'efficacité et de fonctionnalité.
Selon les informations disponibles, Qwen 3.5 utilise un nouveau mécanisme d'attention hybride (mixed attention mechanism). Cela pourrait entraîner une augmentation de l'efficacité du traitement de l'information et une amélioration de la qualité du texte généré.
Mais ce qui est encore plus intéressant, c'est que Qwen 3.5 est probablement un modèle Vision-Language (VLM), intrinsèquement capable de comprendre les informations visuelles. Cela signifie que le modèle pourra traiter des images et des vidéos ainsi que du texte, ouvrant de nouvelles possibilités pour créer des applications d'IA multimodales.
Les développeurs ont également découvert qu'Alibaba prévoit d'ouvrir le code source d'au moins deux versions de Qwen 3.5 : un modèle dense avec 2 milliards de paramètres et un modèle Mixture of Experts (MoE) avec 35 à 343 milliards de paramètres. L'ouverture du code source permettra aux chercheurs et développeurs du monde entier d'étudier, d'adapter et d'améliorer le modèle, ce qui contribuera au développement des technologies d'IA.
Le lancement de Qwen 3.5 a des implications sérieuses pour l'industrie de l'intelligence artificielle. Premièrement, cela renforce la position d'Alibaba comme l'un des leaders du développement des LLM. Deuxièmement, le soutien pour la compréhension visuelle ouvre de nouvelles opportunités pour créer des applications d'IA combinant texte et images. Troisièmement, l'ouverture du code source des modèles Qwen 3.5 favorisera le développement de la communauté d'IA et accélèrera l'innovation dans ce domaine. Pour les utilisateurs, cela signifie l'émergence d'outils d'IA plus puissants et polyvalents capables de résoudre un large éventail de tâches, allant de la création automatique de contenu à l'analyse d'images et de vidéos.
En conclusion, le lancement de Qwen 3.5 est une étape importante dans le développement des grands modèles de langage. La nouvelle architecture, le soutien pour la compréhension visuelle et l'ouverture du code source font de ce modèle un outil prometteur pour les chercheurs, les développeurs et les utilisateurs. Alibaba continue de démontrer son engagement envers l'innovation en intelligence artificielle, et Qwen 3.5 en est une preuve claire. Il ne reste plus qu'à attendre la sortie officielle pour voir comment Qwen 3.5 se comportera en pratique.
Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?
AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.