Alibaba готовит к выпуску новую модель Qwen 3.5
Alibaba, вероятно, скоро представит Qwen 3.5, новую версию своей базовой модели Qwen. Информация о Qwen 3.5 появилась в HuggingFace. Ожидается, что модель будет

В мире искусственного интеллекта грядут перемены: по данным издания 36氪, компания Alibaba готовится к выпуску новой версии своей базовой модели Qwen, получившей название Qwen 3.5. Подтверждением этого служит появление запроса на включение Qwen 3.5 в библиотеку Transformers на платформе HuggingFace, крупнейшем в мире AI-сообществе с открытым исходным кодом. Этот шаг сигнализирует о скором релизе и вызывает большой интерес в отрасли.
Что же такое Qwen и почему это важно? Qwen – это семейство больших языковых моделей (LLM), разработанных Alibaba Group. Эти модели, как и другие LLM, способны генерировать текст, переводить языки, писать различные виды креативного контента и отвечать на ваши вопросы информативным образом. Они являются краеугольным камнем многих современных AI-приложений, от чат-ботов до систем автоматического создания контента. Обновление до версии 3.5 означает значительные улучшения в производительности, эффективности и функциональности.
Согласно имеющейся информации, Qwen 3.5 использует новую гибридную архитектуру внимания (mixed attention mechanism). Это может привести к повышению эффективности обработки информации и улучшению качества генерируемого текста. Но что еще более интересно, Qwen 3.5, вероятно, является моделью типа VLM (Vision-Language Model), изначально способной понимать визуальную информацию. Это означает, что модель сможет обрабатывать изображения и видео, а также текст, открывая новые возможности для создания мультимодальных AI-приложений. Разработчики также обнаружили, что Alibaba планирует открыть исходный код как минимум для двух версий Qwen 3.5: плотной модели размером 2 миллиарда параметров и MoE-модели (Mixture of Experts) размером от 35 до 3 А3 миллиардов параметров. Открытие исходного кода позволит исследователям и разработчикам по всему миру изучать, адаптировать и улучшать модель, что будет способствовать развитию AI-технологий.
Выход Qwen 3.5 имеет серьезные последствия для индустрии искусственного интеллекта. Во-первых, это укрепляет позиции Alibaba как одного из лидеров в области разработки LLM. Во-вторых, поддержка визуального понимания открывает новые возможности для создания AI-приложений, объединяющих текст и изображения. В-третьих, открытие исходного кода моделей Qwen 3.5 будет способствовать развитию AI-сообщества и ускорит инновации в этой области. Для пользователей это означает появление более мощных и универсальных AI-инструментов, которые смогут решать широкий круг задач, от автоматического создания контента до анализа изображений и видео.
В заключение, выпуск Qwen 3.5 – это важный шаг вперед в развитии больших языковых моделей. Новая архитектура, поддержка визуального понимания и открытие исходного кода делают эту модель перспективным инструментом для исследователей, разработчиков и пользователей. Alibaba продолжает демонстрировать свою приверженность инновациям в области искусственного интеллекта, и Qwen 3.5 является ярким тому подтверждением. Теперь остается дождаться официального релиза и увидеть, как Qwen 3.5 проявит себя на практике.