Jiqizhixin (机器之心)→ оригинал

ByteDance y Li Han: cómo hacer que las redes neuronales trabajen, no solo hablen

Доктор Ли Хан из ByteDance представил теоретический фундамент для создания универсальных ИИ-агентов. Вместо того чтобы просто улучшать чат-ботов, компания предл

ByteDance y Li Han: cómo hacer que las redes neuronales trabajen, no solo hablen
Источник: Jiqizhixin (机器之心). Коллаж: Hamidun News.

Мы слишком долго воспринимали большие языковые модели как продвинутую поисковую строку или забавного собеседника. Пока OpenAI и Google соревнуются в количестве параметров, в недрах ByteDance решили, что пора переходить от слов к делу. Доктор Ли Хан, чьё имя в мире обработки естественного языка весит примерно столько же, сколько весь серверный парк среднего стартапа, опубликовал работу о создании универсального фреймворка для ИИ-агентов.

Если вкратце: эпоха «просто чатов» официально подходит к концу. Нужно понимать контекст. Ли Хан — это не просто очередной исследователь.

Его путь через Microsoft Research Asia и Huawei к позиции руководителя ИИ-лаборатории ByteDance говорит о том, что его интересует не теоретическая красота, а прикладная мощь. Сегодняшние попытки создать агентов вроде AutoGPT или BabyAGI часто напоминают сборку самолета из палок и скотча: они ломаются на втором шаге и галлюцинируют в бесконечных циклах. Ли Хан предлагает системный подход, который должен превратить эти «игрушки» в надежный промышленный инструмент.

Что именно изменилось в подходе? Предложенный универсальный фреймворк фокусируется на четырех критических узлах: восприятии, планировании, памяти и действии. Основная проблема современных моделей в том, что они не умеют планировать наперед.

Они живут моментом, генерируя следующий токен. Ли Хан предлагает архитектуру, где модель сначала строит иерархическое дерево целей, а затем использует внешние инструменты для их достижения, постоянно сверяясь с долгосрочной памятью. Это превращает ИИ из студента-филолога в опытного проджект-менеджера.

Почему это критически важно именно сейчас? Мы уперлись в потолок полезности обычных чат-ботов. Чтобы ИИ приносил реальные деньги в B2B-секторе, он должен уметь самостоятельно зайти в CRM, проанализировать данные, составить отчет и отправить его клиенту, не спрашивая разрешения на каждый чих.

ByteDance, с её колоссальными объемами данных и сложнейшими алгоритмами рекомендаций, как никто другой нуждается в таких автономных системах. Если этот фреймворк будет успешно внедрен, мы увидим волну автоматизации, которая сделает нынешние RPA-системы похожими на калькуляторы. Анализируя работу Ли Хана, понимаешь, что Китай в лице ByteDance делает ставку на структурность.

Пока западные компании зачастую полагаются на «сырую мощь» вычислений, здесь мы видим попытку создать элегантную и масштабируемую инженерную схему. Это прямой вызов проектам вроде Microsoft AutoGen. Вопрос лишь в том, кто первым сможет перенести эти выкладки из академических PDF-файлов в реальный продакшн.

Судя по темпам ByteDance, ждать осталось недолго. Главное: Станет ли архитектура Ли Хана мировым стандартом или останется внутренним инструментом ByteDance? Если первое — нас ждёт бум настоящих цифровых сотрудников уже в следующем году.

ЖХ
Hamidun News
AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.
Загружаем комментарии…