36Kr (36氪)→ оригинал

Modelo de 3.000 millones de parámetros de un gigante chino de recursos humanos lidera ranking de HuggingFace

El laboratorio Nanbeige (南北阁), perteneciente al gigante chino del reclutamiento Boss Zhipin (Boss直聘), lanzó el modelo abierto Nanbeige4.1-3B con solo 3.000 mill

Modelo de 3.000 millones de parámetros de un gigante chino de recursos humanos lidera ranking de HuggingFace
Источник: 36Kr (36氪). Коллаж: Hamidun News.
◐ Слушать статью

Когда рекрутинговая платформа начинает обгонять профильные AI-лаборатории в рейтингах открытых моделей, это говорит о чём-то большем, чем просто удачный релиз. Именно это произошло 22 февраля, когда компактная модель Nanbeige4.1-3B от китайского HR-гиганта Boss Zhipin (Boss直聘) заняла первое место в трендах текстовых моделей на HuggingFace и вошла в тройку общего глобального рейтинга.

Boss Zhipin — это крупнейшая в Китае платформа онлайн-рекрутинга, аналог HeadHunter или LinkedIn, только с прямым чатом между соискателями и работодателями. Компания давно инвестирует в AI для улучшения матчинга резюме и вакансий, но выход на арену открытых языковых моделей — шаг принципиально иного масштаба. Исследовательское подразделение Nanbeige Lab (南北阁实验室) было создано именно для этих целей, и теперь его работа привлекла внимание глобального AI-сообщества.

Главная интрига Nanbeige4.1-3B — в её размере. Три миллиарда параметров по меркам 2026 года — это ультракомпактная модель. Для сравнения: последние версии Llama от Meta оперируют десятками и сотнями миллиардов параметров, а флагманские модели DeepSeek, Qwen и других китайских разработчиков давно перешагнули отметку в 70 миллиардов. Тем не менее, по заявлениям разработчиков, Nanbeige4.1-3B демонстрирует впечатляющую межзадачную генерализацию — она справляется с общими вопросами-ответами, сложными цепочками рассуждений, генерацией кода и задачами глубокого поиска информации. Если эти результаты подтвердятся независимыми бенчмарками, речь идёт о серьёзном достижении в области эффективности малых моделей.

Тренд на компактные, но мощные модели набирает силу уже больше года. Microsoft с линейкой Phi, Google с Gemma, Alibaba с мини-версиями Qwen — все крупные игроки поняли, что будущее AI не только в гигантских моделях для дата-центров, но и в решениях, которые можно запустить на смартфоне, ноутбуке или встроенном устройстве. Модель с тремя миллиардами параметров потенциально может работать локально, без обращения к облаку, что критически важно для приватности данных — особенно в контексте HR, где обрабатываются резюме, персональная информация и переписка между кандидатами и работодателями.

Именно здесь кроется стратегическая логика Boss Zhipin. Компания обрабатывает миллионы взаимодействий ежедневно, и компактная модель, способная выполнять сложные задачи без дорогостоящей облачной инференции, может радикально снизить операционные расходы. Более того, открытый характер релиза — модель доступна на HuggingFace — намекает на амбиции, выходящие за пределы внутреннего использования. Boss Zhipin, похоже, хочет позиционировать свою лабораторию как полноценного игрока на рынке foundation-моделей.

Стоит, впрочем, сделать важную оговорку. Попадание в тренды HuggingFace отражает прежде всего интерес сообщества — количество загрузок, лайков и обсуждений — а не объективное качество модели по стандартизированным бенчмаркам. Вирусный эффект, удачный маркетинг и новизна подхода могут объяснять высокие позиции в рейтинге не меньше, чем реальные технические достижения. Для полноценной оценки необходимо дождаться независимого тестирования на MMLU, HumanEval, GSM8K и других общепринятых бенчмарках, а также сравнения с прямыми конкурентами аналогичного размера.

Тем не менее, сам факт появления конкурентоспособной модели от компании, чей основной бизнес — рекрутинг, подчёркивает важный сдвиг в индустрии. Разработка языковых моделей перестаёт быть прерогативой специализированных AI-лабораторий. Крупные технологические компании из смежных отраслей всё чаще создают собственные исследовательские подразделения и выпускают модели, способные конкурировать с продуктами профильных разработчиков. В Китае этот процесс идёт особенно интенсивно: после успеха DeepSeek, который показал, что можно добиться впечатляющих результатов без бюджетов уровня OpenAI, волна амбициозных проектов захлестнула самые неожиданные компании.

Nanbeige4.1-3B — это ещё одно подтверждение того, что гонка в AI всё больше смещается от «кто построит самую большую модель» к «кто сделает самую эффективную маленькую». И если рекрутинговая платформа может создать модель, претендующую на лидерство в своём классе, значит, барьер входа в разработку foundation-моделей продолжает снижаться — со всеми вытекающими последствиями для конкуренции, инноваций и доступности AI-технологий.

ЖХ
Hamidun News
AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.
Загружаем комментарии…