Jiqizhixin (机器之心)→ original

Yao Shunyue en Tencent: por qué la estrella principal de la investigación en IA comenzó desde lo básico

Imagina al mejor delantero del mundo pasándose a un nuevo club y en el primer partido, en lugar de simplemente anotar goles, comienza a reescribir el manual…

Procesado por IA desde Jiqizhixin (机器之心); editado por Hamidun News
Yao Shunyue en Tencent: por qué la estrella principal de la investigación en IA comenzó desde lo básico
Fuente: Jiqizhixin (机器之心). Collage: Hamidun News.
◐ Escuchar artículo

Imagina al mejor delantero del mundo pasándose a un nuevo club y en el primer partido, en lugar de simplemente anotar goles, comienza a reescribir el manual de tácticas. Así es más o menos como se ve el primer trabajo científico de Yao Shunyu bajo los auspicios de Tencent. Para quienes se lo perdieron: Yao es una figura legendaria en círculos estrechos de investigadores.

Es el responsable de regalarnos ReAct (Reason + Act) y Tree of Thoughts, enseñando a las redes neuronales no solo a producir texto, sino a planificar sus acciones y razonar. Su reciente traslado de Princeton a la división de investigación de Tencent causó un efecto de bomba en la industria. Y ahora estamos viendo los primeros frutos de esta unión.

En lugar de anunciar inmediatamente un asesino del GPT-5, Yao y su equipo decidieron mirar bajo el capó de uno de los fenómenos más misteriosos en el mundo de los grandes modelos de lenguaje: el aprendizaje en contexto (In-Context Learning, ICL). Si alguna vez le diste a una red neuronal un par de ejemplos en un prompt y mágicamente entendió la tarea, te encontraste con ICL. Es la capacidad del modelo de aprender sin cambiar sus pesos, durante el mismo proceso de diálogo.

Hasta ahora, este proceso se parecía a la alquimia: sabíamos que funcionaba, pero no entendíamos completamente cómo el modelo estructuraba ese conocimiento internamente. El trabajo de Yao intenta convertir esta alquimia en una ciencia rigurosa. ¿Por qué Tencent dedicó sus mejores mentes a esta dirección ahora?

La respuesta está en el estado actual del mercado. La era en que podías simplemente enterrar un modelo en datos y tarjetas gráficas se está terminando. Estamos entrando en la segunda mitad del juego, donde la victoria irá a quien haga los modelos más inteligentes y eficientes a nivel de arquitectura.

El aprendizaje en contexto es la clave para crear agentes verdaderamente autónomos. Si el modelo entiende mejor el contexto, comete menos errores en cadenas complejas de razonamiento y requiere menos recursos computacionales para adaptarse a las necesidades específicas del negocio. Tencent claramente apuesta por la calidad del razonamiento, no por la cantidad de parámetros.

En su trabajo, los investigadores analizan exactamente cómo las distribuciones de datos de entrada influyen en la capacidad de generalización del modelo. Esto no es solo una investigación teórica. Entender la mecánica del ICL permite crear sistemas más estables que no se rompan por una sola palabra mal elegida en una instrucción.

Ante la feroz competencia con Alibaba y DeepSeek, es vital para Tencent tener una ventaja tecnológica que no pueda simplemente copiarse comprando otros diez mil chips H100. Necesitan avances algorítmicos, y Yao Shunyu es exactamente la persona que puede entregarlos. También es interesante cómo este trabajo se ajusta a la estrategia más amplia de los gigantes tecnológicos chinos.

Vemos un cambio claro de copiar arquitecturas occidentales a intentar liderar la investigación fundamental. Si antes las empresas chinas a menudo jugaban el papel de seguidoras, ahora están contratando a los mejores científicos directamente de los bancos de las principales universidades estadounidenses y les dan carta blanca para investigación profunda. Esto crea una nueva dinámica en la industria, donde los límites entre la ciencia académica y el desarrollo corporativo finalmente se desvanecen.

En pocas palabras: Tencent está invirtiendo en la fundación, no en la fachada. Si Yao Shunyu descifera la mecánica del aprendizaje en contexto, la siguiente iteración de sus modelos podría dejar a los competidores muy atrás por eficiencia, no por fuerza bruta. ¿Puede la comprensión del ICL convertirse en la palanca que cambie nuestra comprensión de las posibilidades de las arquitecturas actuales?

ZK
Hamidun News
Noticias de AI sin ruido. Selección editorial diaria de más de 400 fuentes. Producto de Zhemal Khamidun, Head of AI en Alpina Digital.

¿Quieres dejar de leer sobre IA y empezar a usarla?

AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.

¿Qué te parece?
Cargando comentarios…