3DNews AI→ original

GPT-5.2 obtuvo los mejores resultados en las pruebas de admisión de las universidades de Tokio y Kioto

GPT-5.2 en modo de razonamiento obtuvo los mejores resultados en las pruebas de admisión de las universidades de Tokio y Kioto. En las pruebas de LifePrompt…

Procesado por IA desde 3DNews AI; editado por Hamidun News
GPT-5.2 obtuvo los mejores resultados en las pruebas de admisión de las universidades de Tokio y Kioto
Fuente: 3DNews AI. Collage: Hamidun News.
◐ Escuchar artículo

GPT-5.2 ha alcanzado otro hito, considerado durante mucho tiempo territorio exclusivamente humano: en pruebas sobre preguntas de exámenes de ingreso de las universidades de Tokio y Kioto, el modelo demostró resultados superiores a los de los solicitantes de este año. Y no se trata simplemente de superar un umbral — según LifePrompt, el sistema en modo de razonamiento alcanzó un nivel que supera incluso las puntuaciones de aprobación más altas en múltiples programas, incluida medicina.

Las pruebas fueron realizadas por LifePrompt, comparando las respuestas del modelo con las preguntas reales del examen y los resultados de la campaña de admisión actual. Es importante destacar que esto no es una participación oficial de la red neuronal en las admisiones universitarias japonesas ni una historia sobre matriculación: es, en cambio, una prueba de estrés de las capacidades académicas del modelo en el entorno más competitivo posible. Pero es precisamente este formato el que resulta valioso: permite evaluar no un benchmark abstracto, sino cómo la IA maneja tareas complejas en las que se filtran los candidatos más fuertes.

La elección del lugar tampoco es accidental. Las universidades de Tokio y Kioto son las dos instituciones más prestigiosas y selectivas de Japón, y los programas de medicina tradicionalmente se encuentran entre los más difíciles para ingresar. Si el modelo realmente supera el umbral superior de las puntuaciones de aprobación en tales programas, esto significa mucho más que mera erudición.

Es evidencia de capacidad estable para trabajar con tareas que requieren lógica, largas cadenas de razonamiento, cálculos precisos y la capacidad de mantener el contexto entre múltiples condiciones. Según la descripción de la prueba, el modo de razonamiento jugó un papel clave. En este modo, el modelo dedica más tiempo al análisis interno del problema antes de entregar la respuesta final.

Para exámenes de ingreso esto es especialmente importante: tales preguntas frecuentemente castigan no la falta de conocimiento, sino una única conexión intermedia incorrecta. Por lo tanto, el progreso de estos sistemas cada vez menos se parece a "adivinanzas estadísticas" y cada vez más a la resolución completa de problemas en formato paso a paso. Al mismo tiempo, esto no elimina limitaciones: incluso una puntuación sobresaliente en conjuntos de exámenes aún no prueba que el modelo sea igualmente confiable en diálogo en vivo, trabajo de investigación o decisiones clínicas.

Para la educación, esto señala implicaciones en varias direcciones. Primero, los exámenes estándar están cada vez más fallando en servir como filtros puros de conocimiento, si un modelo de razonamiento poderoso puede consistentemente pasarlos mejor que la mayoría de las personas. Segundo, el valor de la preparación en sí está cambiando: resolver mecánicamente tareas familiares se vuelve menos importante que la capacidad de formular preguntas, verificar pasos intermedios, defender conclusiones y trabajar en conjunto con herramientas de IA.

Finalmente, tales resultados impulsan a las universidades a reconsiderar métodos de evaluación—incorporando más componentes orales, trabajo en proyectos y tareas en las que la argumentación independiente es crítica, no solo la respuesta final en una hoja de prueba. Para el mercado de IA, esto también es una demostración de hacia dónde se dirige la competencia entre modelos. El sistema ganador ya no es el que formula el texto más elegantemente, sino el que sostiene cargas cognitivas largas y mantiene precisión bajo presión de condiciones complejas.

Los exámenes académicos son valiosos precisamente porque tienen un alto costo de error y criterios de éxito claros. Si un modelo comienza a ganar consistentemente en tal entorno, su potencial se extiende rápidamente más allá de la educación—hacia análisis, cálculos de ingeniería, preparación para certificaciones y otros campos donde el pensamiento disciplinado es esencial. La conclusión principal es simple: la barra para la IA "inteligente" ha subido nuevamente, y ahora la pregunta ya no es si un modelo puede aprobar un examen difícil, sino cómo las personas e instituciones deben reestructurar las reglas en torno a este hecho.

Por ahora, tales pruebas siguen siendo más una demostración de capacidades que un reemplazo de la experiencia genuina. Pero la brecha entre tareas académicas para humanos y para modelos poderosos continúa estrechándose rápidamente.

ZK
Hamidun News
Noticias de AI sin ruido. Selección editorial diaria de más de 400 fuentes. Producto de Zhemal Khamidun, Head of AI en Alpina Digital.

¿Quieres dejar de leer sobre IA y empezar a usarla?

AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.

¿Qué te parece?
Cargando comentarios…