HuXiu (虎嗅)→ оригинал

DeepSeek, Kimi et Qwen comparés sur des tâches de travail : test de cinq assistants AI chinois

Cinq assistants AI chinois — Doubao, Qwen, Yuanbao, Kimi et DeepSeek — ont été comparés dans des scénarios de travail réels. Le test portait sur le résumé de te

DeepSeek, Kimi et Qwen comparés sur des tâches de travail : test de cinq assistants AI chinois
Источник: HuXiu (虎嗅). Коллаж: Hamidun News.
◐ Слушать статью

В новом видео-сравнении редакция сопоставила пять китайских AI-помощников — Doubao, Qwen, Yuanbao, Kimi и DeepSeek — в типовых рабочих задачах, где обычно нужен не код, а ежедневная интеллектуальная рутина. В фокусе были текстовая сводка, анализ данных, отраслевые выводы и деловое письмо.

Как проходил тест

Отправная точка у этого сравнения простая: AI уже закрывает значительную часть текстовой работы, которая раньше целиком ложилась на человека. Поэтому авторы не стали мериться абстрактными бенчмарками, а взяли более прикладной сценарий — посмотреть, как разные помощники ведут себя в задачах, похожих на реальные запросы редактора, аналитика, менеджера или исследователя. Такой подход важен, потому что пользователю обычно нужен не “самый умный” бот вообще, а инструмент, который экономит время здесь и сейчас.

«AI уже может решить большую часть текстовых задач, с которыми я сталкиваюсь в работе».

В тест попали пять заметных игроков китайского рынка: Doubao, Qwen, Yuanbao, Kimi и DeepSeek. Их проверяли в одинаковых или близких по смыслу условиях, чтобы увидеть не только качество ответа, но и то, как модель держит структуру, работает с формулировками и справляется с задачами, где нужно не просто продолжить текст, а извлечь из него пользу. Это сравнение скорее про рабочую пригодность, чем про эффектную демонстрацию возможностей.

Какие навыки проверяли

Набор заданий отражает самый частый офисный сценарий использования AI: пользователь приносит большой объём текста или данных и хочет быстро получить понятный результат. Именно на таких задачах сильнее всего видна разница между моделями, потому что одной красивой подачи здесь недостаточно — важны точность, сжатие, логика и умение держать цель ответа до конца. Это тот тип работы, где ошибка видна сразу и быстро влияет на качество финального документа.

  • Сжать длинный материал в краткую и внятную выжимку Разобрать данные и выделить ключевые цифры или отклонения Сформулировать отраслевые инсайты по исходным вводным * Написать текст в нужном стиле и с понятной структурой Проверка именно этих навыков показывает, насколько помощник пригоден как рабочий слой поверх повседневных процессов. Если модель хорошо суммирует, но путается в числах, её сложно доверить аналитической заметке. Если она уверенно пишет, но не умеет строить выводы по индустрии, она остаётся скорее генератором черновиков. Поэтому такие тесты полезны не только ради выбора “победителя”, но и ради понимания специализации каждого инструмента. Именно на этом уровне обычно и принимают решение, стоит ли включать модель в постоянный рабочий стек.

Где видна практическая разница

Главная ценность подобного сравнения в том, что оно выносит AI из режима вау-эффекта в режим утилиты. Для бизнеса и отдельных специалистов вопрос уже не в том, умеет ли модель отвечать на вопросы вообще. Вопрос в другом: можно ли дать ей сырой материал, быстро получить первый проход и затем потратить меньше времени на правки.

Именно здесь проявляются реальные различия — кто лучше держит контекст, кто аккуратнее обращается с данными, а кто пишет более связный и пригодный для публикации текст. На китайском рынке таких помощников становится всё больше, и конкуренция смещается от общих обещаний к качеству конкретной работы. Пользователи сравнивают не число параметров и не громкость маркетинга, а то, сколько шагов остаётся после ответа модели.

Если после AI нужно полностью переписывать текст, его польза быстро исчезает. Если же он выдаёт понятную структуру, не теряет важные детали и экономит хотя бы половину времени на подготовку материала, это уже серьёзное преимущество в реальной работе.

Что это значит

Рынок AI-помощников взрослеет: модели всё чаще оценивают не по эффектным демо, а по тому, как они ведут себя в обычных рабочих задачах. Для пользователя это хороший ориентир: выбирать стоит не “лучший AI вообще”, а помощника под конкретный тип работы — сводки, цифры, отраслевой анализ или черновое письмо. И чем чаще такие сравнения строятся вокруг повседневной рутины, тем проще отделить удобный инструмент от просто громкого имени.

ЖХ
Hamidun News
AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.
Загружаем комментарии…