Jiqizhixin (机器之心)→ original

Google DeepMind gana plata: IA resuelve problemas olímpicos, pero ¿a qué costo?

Mientras todo el mundo discute si ChatGPT alguna vez dejará de cometer errores en las recetas de tartas, Google DeepMind decidió intentar lo sagrado: la…

Procesado por IA desde Jiqizhixin (机器之心); editado por Hamidun News
Google DeepMind gana plata: IA resuelve problemas olímpicos, pero ¿a qué costo?
Fuente: Jiqizhixin (机器之心). Collage: Hamidun News.
◐ Escuchar artículo

Mientras todo el mundo discute si ChatGPT alguna vez dejará de cometer errores en las recetas de tartas, Google DeepMind decidió intentar lo sagrado: la Olimpíada Internacional de Matemáticas (IMO). Los resultados de AlphaProof y AlphaGeometry 2 hicieron estremecer a la industria: los sistemas resolvieron cuatro de seis problemas, lo que corresponde al nivel de un medallista de plata. Parecía ser el momento de la singularidad, cuando el silicio finalmente derrotó al carbono en la lógica pura.

Pero si se observan los detalles de cerca, el triunfo parece más una victoria heroica sobre las circunstancias que un paseo casual. La matemática siempre ha sido el talón de Aquiles de los modelos de lenguaje. Los LLM ordinarios funcionan con probabilidades, prediciendo la siguiente palabra, lo que en el riguroso mundo de las pruebas conduce a alucinaciones inevitables.

Para resolver este problema, los ingenieros de DeepMind siguieron el camino de la hibridación. AlphaProof combina la flexibilidad del aprendizaje por refuerzo con la disciplina severa del lenguaje de verificación formal Lean. Esto permite que la inteligencia artificial no solo adivine la respuesta, sino que escriba código que se verifique a sí mismo en cada paso lógico.

AlphaGeometry 2, a su vez, recibió una inyección poderosa en forma del modelo Gemini, lo que le permitió resolver acertijos geométricos decenas de veces más rápido que su predecesor. Sin embargo, detrás del brillo de la medalla de plata se esconde una realidad desagradable. Mientras que los participantes vivos de la olimpíada resolvieron problemas en dos sesiones de cuatro horas y media, la inteligencia artificial requirió varios días de computación continua para algunas demostraciones.

Esto subraya el principal problema de los sistemas modernos: son colossalmente ineficientes en comparación con el cerebro humano. Vemos un ejemplo clásico de recoger frutos bajos. Sí, la IA ha aprendido a trabajar dentro de los marcos rigurosos de los lenguajes formales, pero aún gasta recursos computacionales colosales donde un adolescente talentoso necesitaría solo un trozo de papel y un par de horas de reflexión.

La brecha en la eficiencia energética entre la inteligencia biológica y digital sigue siendo inmensa. ¿Por qué es importante esto ahora? Estamos presenciando un cambio fundamental en la estrategia de desarrollo de IA.

La industria ha reconocido que simplemente escalar datos ya no proporciona ganancias explosivas de calidad en tareas verdaderamente complejas. El futuro pertenece a sistemas que pueden razonar y verificar sus conclusiones. Google está esencialmente creando lo que se llama Sistema 2 para IA: pensamiento lento y deliberado que complementa el rápido e intuitivo Sistema 1 de los chatbots ordinarios.

Esto es crítico no solo para las matemáticas puras, sino también para la programación, la ciberseguridad y el diseño de sistemas de ingeniería complejos, donde un solo error de un bit puede provocar un desastre. Sin embargo, Demis Hassabis y su equipo reconocen honestamente: el proceso de entrenamiento y operación de estos modelos sigue siendo doloroso. Para que AlphaProof funcione, los problemas deben traducirse manualmente al lenguaje Lean: la IA aún no puede interpretar independientemente las condiciones del problema en lenguaje natural con suficiente precisión.

Hemos adquirido una herramienta poderosa que aún requiere todo un ejército de ingenieros traductores para funcionar. Esto recuerda a las primeras computadoras, que ocupaban salas enteras y requerían tarjetas perforadas. El potencial es enorme, pero llevará años hasta que surja un matemático en tu bolsillo capaz de hacer descubrimientos en tiempo real.

Lo importante: Google DeepMind ha demostrado que la IA puede manejar la lógica de orden superior sin errores, pero el precio de esta infalibilidad sigue siendo exorbitante. ¿Podrá la empresa acelerar radicalmente el razonamiento de sus sistemas antes de fin de año?

ZK
Hamidun News
Noticias de AI sin ruido. Selección editorial diaria de más de 400 fuentes. Producto de Zhemal Khamidun, Head of AI en Alpina Digital.

¿Quieres dejar de leer sobre IA y empezar a usarla?

AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.

¿Qué te parece?
Cargando comentarios…