GPT-5.2 alcançou as melhores notas nas provas de admissão das universidades de Tóquio e Quioto
GPT-5.2 em modo de raciocínio alcançou os melhores resultados nas provas de admissão das universidades de Tóquio e Quioto. Nos testes do LifePrompt, o modelo…
Processado por IA de 3DNews AI; editado por Hamidun News
GPT-5.2 chegou a mais um marco, há muito considerado território exclusivamente humano: em testes sobre questões de exames de admissão das universidades de Tóquio e Kyoto, o modelo demonstrou resultados superiores aos dos candidatos deste ano. E não se trata apenas de ultrapassar um limiar — segundo a LifePrompt, o sistema em modo de raciocínio atingiu um nível que supera até as pontuações de aprovação mais altas em diversos programas, incluindo medicina.
Os testes foram conduzidos pela LifePrompt, comparando as respostas do modelo com as questões reais do exame e os resultados da campanha de admissão efetiva. É importante notar que não se trata de participação oficial da rede neural nas admissões universitárias japonesas, nem de uma história sobre admissão: é, em vez disso, um teste de estresse das capacidades acadêmicas do modelo no ambiente mais competitivo possível. Mas é precisamente esse formato que se prova valioso: permite avaliar não um benchmark abstrato, mas como a IA lida com tarefas complexas em que os candidatos mais fortes são eliminados.
A escolha do local também não é acidental. As universidades de Tóquio e Kyoto são as duas instituições mais prestigiosas e seletivas do Japão, e programas de medicina tradicionalmente se encontram entre os mais difíceis para ingresso. Se o modelo realmente supera o limite superior das notas de aprovação em tais programas, isso significa muito mais do que mera erudição.
É evidência de capacidade estável de lidar com tarefas que exigem lógica, longas cadeias de raciocínio, cálculos precisos e a capacidade de manter o contexto entre múltiplas condições. De acordo com a descrição do teste, o modo de raciocínio desempenhou papel crucial. Neste modo, o modelo gasta mais tempo na análise interna do problema antes de entregar a resposta final.
Para exames de admissão isso é especialmente importante: tais questões frequentemente penalizam não a falta de conhecimento, mas uma única conexão intermediária incorreta. Portanto, o progresso desses sistemas cada vez menos se assemelha a "adivinhação estatística" e cada vez mais a resolução completa de problemas em formato passo a passo. Simultaneamente, isso não elimina limitações: mesmo uma pontuação excepcional em conjuntos de exames ainda não prova que o modelo é igualmente confiável em diálogo ao vivo, trabalho de pesquisa ou decisões clínicas.
Para a educação, isso sinaliza implicações em várias direções. Primeiro, exames padrão estão cada vez mais falhando em servir como filtros puros de conhecimento, se um modelo de raciocínio poderoso consegue consistentemente passá-los melhor do que a maioria das pessoas. Segundo, o valor da própria preparação está mudando: resolver mecanicamente tarefas familiares torna-se menos importante do que a capacidade de formular perguntas, verificar etapas intermediárias, defender conclusões e trabalhar em conjunto com ferramentas de IA.
Finalmente, tais resultados impulsionam universidades a reconsiderar métodos de avaliação—incorporando mais componentes orais, trabalho em projetos e tarefas em que argumentação independente é crítica, não apenas a resposta final em uma folha de teste. Para o mercado de IA, isso também é uma demonstração de para onde a competição entre modelos está se dirigindo. O sistema vencedor não é mais o que formula o texto mais elegantemente, mas o que sustenta longas cargas cognitivas e mantém precisão sob pressão de condições complexas.
Exames acadêmicos são valiosos precisamente porque têm custo de erro alto e critérios de sucesso claros. Se um modelo começa a vencer consistentemente nesse ambiente, seu potencial rapidamente se estende além da educação—para análise, cálculos de engenharia, preparação para certificações e outros campos em que o pensamento disciplinado é essencial. A conclusão principal é simples: a barra para IA "inteligente" subiu novamente, e agora a questão já não é se um modelo consegue passar em um exame difícil, mas como pessoas e instituições precisam reestruturar as regras em torno desse fato.
Por enquanto, tais testes permanecem mais uma demonstração de capacidades do que uma substituição da expertise genuína. Mas a lacuna entre tarefas acadêmicas para humanos e para modelos poderosos continua se estreitando rapidamente.
Quer parar de ler sobre IA e começar a usar?
AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.