Jiqizhixin (机器之心)→ оригинал

Яо Шуньюй в Tencent: почему главная звезда AI-исследований начала с основ

Переход Яо Шуньюя (Yao Shunyu) из Принстона в Tencent стал одной из самых громких новостей в индустрии. Теперь мы видим первые результаты: свежую работу по In-C

Яо Шуньюй в Tencent: почему главная звезда AI-исследований начала с основ
Источник: Jiqizhixin (机器之心). Коллаж: Hamidun News.

Представьте, что лучший нападающий мира переходит в новый клуб и в первом же матче вместо того, чтобы просто забивать голы, начинает переписывать учебник по тактике. Примерно так выглядит выход первой научной работы Яо Шуньюя (Yao Shunyu) под эгидой Tencent. Для тех, кто пропустил: Яо — это человек-легенда в узких кругах исследователей.

Именно он подарил нам ReAct (Reason + Act) и Tree of Thoughts, научив нейросети не просто выдавать текст, а планировать свои действия и рассуждать. Его недавний переход из Принстона в исследовательское подразделение Tencent вызвал в индустрии эффект разорвавшейся бомбы. И вот мы видим первые результаты этого союза.

Вместо того чтобы сразу анонсировать убийцу GPT-5, Яо и его команда решили заглянуть под капот одного из самых загадочных явлений в мире больших языковых моделей — контекстного обучения (In-Context Learning, ICL /). Если вы когда-нибудь давали нейросети пару примеров в промпте и она магическим образом понимала задачу, вы сталкивались с ICL. Это способность модели обучаться без изменения своих весов, прямо в процессе диалога.

До сих пор этот процесс напоминал алхимию: мы знали, что это работает, но не совсем понимали, как именно модель структурирует эти знания внутри себя. Работа Яо пытается превратить эту алхимию в строгую науку. Почему Tencent бросил свои лучшие умы именно на это направление сейчас?

Ответ кроется в текущем состоянии рынка. Эпоха, когда можно было просто заваливать модель данными и видеокартами, подходит к концу. Наступает вторая половина игры, где победит тот, кто сделает модели умнее и эффективнее на уровне архитектуры.

Контекстное обучение — это ключ к созданию по-настоящему автономных агентов. Если модель лучше понимает контекст, она совершает меньше ошибок в сложных цепочках рассуждений и требует меньше вычислительных ресурсов для адаптации под конкретные нужды бизнеса. Tencent явно делает ставку на качество рассуждений, а не на количество параметров.

В своей работе исследователи анализируют, как именно распределения входных данных влияют на способность модели к обобщению. Это не просто теоретические изыскания. Понимание механики ICL позволяет создавать более стабильные системы, которые не ломаются от одного неверно подобранного слова в инструкции.

В условиях жесткой конкуренции с Alibaba и DeepSeek, Tencent жизненно важно иметь технологическое преимущество, которое нельзя просто скопировать, купив еще десять тысяч чипов H100. Им нужны алгоритмические прорывы, и Яо Шуньюй — именно тот человек, который способен их обеспечить. Интересно и то, как эта работа вписывается в общую стратегию китайских техгигантов.

Мы видим явный сдвиг от копирования западных архитектур к попыткам возглавить фундаментальные исследования. Если раньше китайские компании чаще выступали в роли догоняющих, то теперь они нанимают топовых ученых прямо со скамьи ведущих американских университетов и дают им карт-бланш на глубокие исследования. Это создает новую динамику в индустрии, где границы между академической наукой и корпоративной разработкой окончательно стираются.

Главное: Tencent инвестирует в фундамент, а не в фасад. Если Яо Шуньюй разберется в механике контекстного обучения, следующая итерация их моделей может оставить конкурентов далеко позади за счет эффективности, а не грубой силы. Сможет ли понимание ICL стать тем самым рычагом, который перевернет представление о возможностях текущих архитектур?

ЖХ
Hamidun News
AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.
Загружаем комментарии…