36Kr (36氪)→ оригинал

Модель с 3 миллиардами параметров от китайского HR-гиганта возглавила рейтинг HuggingFace

Лаборатория Nanbeige (南北阁), принадлежащая китайскому рекрутинговому гиганту Boss Zhipin (Boss直聘), выпустила открытую модель Nanbeige4.1-3B всего с 3 миллиардами

Модель с 3 миллиардами параметров от китайского HR-гиганта возглавила рейтинг HuggingFace
Источник: 36Kr (36氪). Коллаж: Hamidun News.

Когда рекрутинговая платформа начинает обгонять профильные AI-лаборатории в рейтингах открытых моделей, это говорит о чём-то большем, чем просто удачный релиз. Именно это произошло 22 февраля, когда компактная модель Nanbeige4.1-3B от китайского HR-гиганта Boss Zhipin (Boss直聘) заняла первое место в трендах текстовых моделей на HuggingFace и вошла в тройку общего глобального рейтинга.

Boss Zhipin — это крупнейшая в Китае платформа онлайн-рекрутинга, аналог HeadHunter или LinkedIn, только с прямым чатом между соискателями и работодателями. Компания давно инвестирует в AI для улучшения матчинга резюме и вакансий, но выход на арену открытых языковых моделей — шаг принципиально иного масштаба. Исследовательское подразделение Nanbeige Lab (南北阁实验室) было создано именно для этих целей, и теперь его работа привлекла внимание глобального AI-сообщества.

Главная интрига Nanbeige4.1-3B — в её размере. Три миллиарда параметров по меркам 2026 года — это ультракомпактная модель. Для сравнения: последние версии Llama от Meta оперируют десятками и сотнями миллиардов параметров, а флагманские модели DeepSeek, Qwen и других китайских разработчиков давно перешагнули отметку в 70 миллиардов. Тем не менее, по заявлениям разработчиков, Nanbeige4.1-3B демонстрирует впечатляющую межзадачную генерализацию — она справляется с общими вопросами-ответами, сложными цепочками рассуждений, генерацией кода и задачами глубокого поиска информации. Если эти результаты подтвердятся независимыми бенчмарками, речь идёт о серьёзном достижении в области эффективности малых моделей.

Тренд на компактные, но мощные модели набирает силу уже больше года. Microsoft с линейкой Phi, Google с Gemma, Alibaba с мини-версиями Qwen — все крупные игроки поняли, что будущее AI не только в гигантских моделях для дата-центров, но и в решениях, которые можно запустить на смартфоне, ноутбуке или встроенном устройстве. Модель с тремя миллиардами параметров потенциально может работать локально, без обращения к облаку, что критически важно для приватности данных — особенно в контексте HR, где обрабатываются резюме, персональная информация и переписка между кандидатами и работодателями.

Именно здесь кроется стратегическая логика Boss Zhipin. Компания обрабатывает миллионы взаимодействий ежедневно, и компактная модель, способная выполнять сложные задачи без дорогостоящей облачной инференции, может радикально снизить операционные расходы. Более того, открытый характер релиза — модель доступна на HuggingFace — намекает на амбиции, выходящие за пределы внутреннего использования. Boss Zhipin, похоже, хочет позиционировать свою лабораторию как полноценного игрока на рынке foundation-моделей.

Стоит, впрочем, сделать важную оговорку. Попадание в тренды HuggingFace отражает прежде всего интерес сообщества — количество загрузок, лайков и обсуждений — а не объективное качество модели по стандартизированным бенчмаркам. Вирусный эффект, удачный маркетинг и новизна подхода могут объяснять высокие позиции в рейтинге не меньше, чем реальные технические достижения. Для полноценной оценки необходимо дождаться независимого тестирования на MMLU, HumanEval, GSM8K и других общепринятых бенчмарках, а также сравнения с прямыми конкурентами аналогичного размера.

Тем не менее, сам факт появления конкурентоспособной модели от компании, чей основной бизнес — рекрутинг, подчёркивает важный сдвиг в индустрии. Разработка языковых моделей перестаёт быть прерогативой специализированных AI-лабораторий. Крупные технологические компании из смежных отраслей всё чаще создают собственные исследовательские подразделения и выпускают модели, способные конкурировать с продуктами профильных разработчиков. В Китае этот процесс идёт особенно интенсивно: после успеха DeepSeek, который показал, что можно добиться впечатляющих результатов без бюджетов уровня OpenAI, волна амбициозных проектов захлестнула самые неожиданные компании.

Nanbeige4.1-3B — это ещё одно подтверждение того, что гонка в AI всё больше смещается от «кто построит самую большую модель» к «кто сделает самую эффективную маленькую». И если рекрутинговая платформа может создать модель, претендующую на лидерство в своём классе, значит, барьер входа в разработку foundation-моделей продолжает снижаться — со всеми вытекающими последствиями для конкуренции, инноваций и доступности AI-технологий.

ЖХ
Hamidun News
AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.
Загружаем комментарии…