Habr AI→ original

Por qué los benchmarks de AGI nunca serán objetivos

Los científicos intentan crear pruebas objetivas para AGI que sustituyan al obsoleto test de Turing. Pero hay un problema: no existe una definición única de int

Por qué los benchmarks de AGI nunca serán objetivos
Fuente: Habr AI. Collage: Hamidun News.
◐ Escuchar artículo

La Prueba de Turing, que una vez pareció una verificación ideal de la inteligencia, ahora está claramente obsoleta. Los investigadores buscan nuevas formas de evaluar si un sistema ha alcanzado el nivel de inteligencia artificial fuerte — pero se enfrentan a un obstáculo inesperado.

Por qué la Prueba de Turing ya no funciona

Cuando Alan Turing propuso su famosa prueba en 1950, la idea era simple: si una máquina puede convencer a un humano de que es humano, entonces piensa. Setenta años después, los LLM modernos pasan fácilmente esta prueba — pero esto no significa que sean inteligentes en el sentido de AGI. Los investigadores reconocen: se necesitan nuevos criterios. Conferencias como IEEE buscan nuevos benchmarks para evaluar la IA fuerte. El problema es que los criterios deben ser objetivos — y esto es mucho más difícil de lo que parecía.

Setenta definiciones de inteligencia

El primer obstáculo: los propios científicos no pueden ponerse de acuerdo sobre qué es la inteligencia. Existen al menos 70 definiciones científicas diferentes de la inteligencia humana. Algunos consideran que la inteligencia es la capacidad de adaptarse, otros la velocidad del procesamiento de información, otros la creatividad. Si no podemos definir objetivamente la inteligencia ni siquiera en nuestra propia especie, ¿cómo podemos crear una prueba para evaluarla en una máquina?

  • Definición a través del CI (lógica y aritmética)
  • Definición a través de la adaptabilidad (qué tan rápido aprende en un nuevo entorno)
  • Definición a través del contexto (comprensión de matices y cultura)
  • Definición a través de la creatividad (ideas y soluciones originales)

La paradoja de la conciencia en redes neuronales

El segundo obstáculo — debates científicos interminables sobre si los LLM pueden desarrollar conciencia. Docenas de trabajos en arxiv examinan si hay una "vida interior" en los grandes modelos de lenguaje. Pero este es un debate extraño. La neurobiología y la psicología establecieron hace mucho: la conciencia en los humanos es más un impedimento que una herramienta del pensamiento. Los procesos cognitivos más eficaces ocurren a nivel subconsciente. Cuando te concentras en una tarea (se activa la conciencia), a menudo comienzas a ralentizarte y a cometer errores. Por eso los atletas hablan de "flujo" — un estado en el que la conciencia se apaga.

La interferencia de la autoconciencia solo obstaculiza la solución de

problemas complejos — establecido en la literatura científica.

Si un modelo alguna vez desarrolla autoconciencia, los ingenieros simplemente eliminarán este bug — para que el sistema funcione más rápido y con mayor precisión, como lo hace ahora.

Lo que significa

La conclusión es paradójica: evaluar AGI objetivamente es imposible no porque la IA sea demasiado inteligente, sino porque no podemos ponernos de acuerdo ni sobre criterios para nuestra propia inteligencia. Cualquier benchmark reflejará una elección subjetiva de qué considerar "inteligencia" — y nadie estará satisfecho con esta elección.

ZK
Hamidun News
Noticias de AI sin ruido. Selección editorial diaria de más de 400 fuentes. Producto de Zhemal Khamidun, Head of AI en Alpina Digital.
¿Qué te parece?
Cargando comentarios…