Wired→ original

El creador de AlphaGo fundó una empresa unicornio para construir super-aprendices de IA

David Silver, el científico cuyo sistema AlphaGo fue el primero en derrotar a un campeón mundial de go en 2016, ha fundado una nueva empresa valuada en mil…

Procesado por IA desde Wired; editado por Hamidun News
El creador de AlphaGo fundó una empresa unicornio para construir super-aprendices de IA
Fuente: Wired. Collage: Hamidun News.
◐ Escuchar artículo

David Silver, el científico que creó el algoritmo AlphaGo que en 2016 se convirtió en el primero en la historia en derrotar al campeón mundial de Go, ha anunciado la fundación de una nueva empresa valorada en aproximadamente mil millones de dólares. Su objetivo es construir lo que Silver llama super-aprendices: sistemas de IA capaces de dominar independientemente dominios complejos del conocimiento sin depender de conjuntos de datos creados por humanos. Este es un desafío directo al paradigma dominante de la industria, en el cual todos los principales actores apuestan por escalar modelos de lenguaje.

Silver es uno de los principales arquitectos de la IA moderna, y su biografía habla por sí sola. Su trabajo en Google DeepMind condujo a AlphaGo y, posteriormente, a AlphaZero—un algoritmo que desde cero dominó el ajedrez, el shogi y Go, sin haber visto jamás una sola partida humana. En lugar de aprender de ejemplos preparados, el sistema generaba y analizaba de forma independiente millones de posiciones, descubriendo estrategias que los jugadores profesionales describían como no humanas.

Es esta experiencia la que forma su convicción sobre lo que debería ser la IA de próxima generación.

La idea central de Silver es a la vez simple y radical: los grandes modelos de lenguaje—ChatGPT, Claude, Gemini y otros—están fundamentalmente limitados por aprender exclusivamente de textos y datos producidos por humanos. Esto crea un techo insuperable: la IA no puede superar las capacidades cognitivas de sus creadores si se alimenta solo de su conocimiento y sus concepciones erróneas. Simplemente aumentar el número de parámetros y el volumen de datos de entrenamiento, según él, no resuelve este problema fundamental—solo lo escala.

La alternativa es el aprendizaje por refuerzo (reinforcement learning, RL). A diferencia del aprendizaje supervisado, donde un modelo aprende a reproducir respuestas correctas de un conjunto de datos previamente etiquetado, el RL permite que un agente explore de forma independiente el espacio de posibilidades: intente acciones, reciba señales de recompensa e itera gradualmente una estrategia. Así es exactamente como funcionaba AlphaGo—y este enfoque, está convencido Silver, abre el camino hacia una IA que supera a los humanos en un amplio espectro de tareas, no solo en juegos predefinidos.

Esta posición tiene argumentos serios a su favor. OpenAI se está moviendo parcialmente en esta dirección con sus modelos de razonamiento de la serie o, que utilizan elementos de RL para la auto-verificación de respuestas. Google DeepMind continúa la investigación fundamental en esta área.

No obstante, la mayor parte de los recursos de la industria permanecen concentrados en escalar modelos de lenguaje, y es precisamente contra esta corriente dominante que Silver asume una postura abiertamente contraria. La principal dificultad con el RL está más allá de tareas estrechas y claramente definidas. Para el ajedrez, es simple establecer la función de recompensa: ganas y obtienes un plus.

Para escribir un texto convincente, tomar una decisión empresarial bien considerada o llevar a cabo investigación científica original, la función de recompensa no es obvia. Es precisamente este problema de la inteligencia inefable el que la nueva empresa debe resolver. La valoración de mil millones de dólares sin un único producto en el mercado habla del peso de la reputación del fundador.

En el actual clima de inversión, cuando cada startup de IA reclama una importancia histórica, el nombre del creador de AlphaGo es simultáneamente una prueba de concepto lista y un seguro para los inversores que no están dispuestos a esperar años.

Si Silver tiene razón, la siguiente fase de la carrera de la IA se verá fundamentalmente diferente: menos datos humanos, más auto-aprendizaje autónomo, menos imitación—más descubrimiento. Sistemas capaces de formar conocimiento de forma independiente más allá de lo que conoce la humanidad—eso es su visión de super-aprendices. Si la idea se materializará en un producto real, el tiempo lo dirá. Pero el hecho de que uno de los principales arquitectos de la IA moderna haga una apuesta pública contra el paradigma dominante es en sí mismo una señal significativa para toda la industria.

ZK
Hamidun News
Noticias de AI sin ruido. Selección editorial diaria de más de 400 fuentes. Producto de Zhemal Khamidun, Head of AI en Alpina Digital.

¿Quieres dejar de leer sobre IA y empezar a usarla?

AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.

¿Qué te parece?
Cargando comentarios…