A Anthropic continua dificultando os testes por causa de cola com Claude
A equipe de otimização de desempenho da Anthropic encontrou um desafio incomum: seu modelo Claude passou a resolver com eficiência demais os testes para…
Processado por IA de TechCrunch; editado por Hamidun News
ANTHROPIC CONSTANTEMENTE TORNA OS TESTES MAIS DIFÍCEIS POR CAUSA DE FRAUDES COM CLAUDE
Em uma era de rápido desenvolvimento da inteligência artificial, quando modelos de linguagem poderosos se tornam acessíveis a uma ampla gama de usuários, os métodos tradicionais de avaliação da qualificação de especialistas enfrentam desafios sem precedentes. O time de otimização de desempenho da empresa americana Anthropic, conhecida pelo desenvolvimento da rede neural avançada Claude, enfrentou um problema inusitado: sua própria criação, ou melhor, ferramentas de IA semelhantes a ela, começaram a "colar" em entrevistas.
Desde o início de 2024, a Anthropic usa um formato de tarefas de codificação para casa para testar as habilidades técnicas de candidatos para posições de engenharia. Essa abordagem se destina a dar aos candidatos a oportunidade de demonstrar seus conhecimentos e habilidades em um ambiente mais calmo e reflexivo do que é possível durante uma entrevista padrão. No entanto, o desenvolvimento de ferramentas de IA para escrita de código, como GitHub Copilot, bem como melhorias nos próprios modelos de linguagem de grande porte, levou a essas tarefas serem resolvidas muito facilmente com sua ajuda.
Isso criou uma situação em que a avaliação objetiva das qualificações de um candidato se tornou difícil, porque era impossível dizer com certeza se o próprio candidato resolveu a tarefa ou se foi a inteligência artificial.
Para combater essa tendência e evitar fraudes, os engenheiros da Anthropic precisam constantemente revisar e aumentar a dificuldade das tarefas de teste. A tarefa é criar problemas que exijam compreensão contextual profunda, abordagens não convencionais e criatividade—áreas onde os modelos de IA modernos, apesar de suas capacidades impressionantes, ainda ficam aquém dos humanos. São tarefas que exigem não simplesmente reproduzir algoritmos conhecidos ou escrever código típico, mas sim problemas em que é necessário analisar sistemas complexos, tomar decisões sob incerteza, integrar conhecimentos dispersos e demonstrar pensamento original. Essas tarefas são mais difíceis de automatizar e mais difíceis de "alimentar" um modelo de linguagem para obter uma solução pronta.
Essa situação destaca a crescente complexidade da avaliação das habilidades humanas em uma era de disponibilidade generalizada de ferramentas poderosas de IA. A fronteira entre competência humana e as capacidades da inteligência artificial está se tornando cada vez mais difusa. Empresas em todo o mundo estão começando a considerar novas abordagens para recrutamento e avaliação de pessoal que pudessem levar em conta as realidades do cenário tecnológico atual.
Talvez o futuro esteja em avaliar não apenas o resultado final, mas também o processo de resolução do problema em si, em analisar o processo de pensamento, em testar a capacidade de adaptação e aprendizagem. A Anthropic, enfrentando esse desafio na vanguarda, está efetivamente demonstrando como a indústria é forçada a se adaptar às condições mutáveis em que a IA se torna não apenas uma ferramenta de trabalho, mas um fator que muda as regras do jogo no processo de contratação.
Em conclusão, o aumento constante na complexidade das tarefas de teste na Anthropic é um exemplo impressionante de como o progresso tecnológico exige flexibilidade e inovação em todas as esferas da atividade humana, incluindo o processo de seleção de pessoal. Isso nos força a reconsiderar o próprio conceito de competência profissional e buscar novos métodos mais confiáveis de avaliação que possam distinguir o talento humano genuíno das respostas de IA habilmente geradas. Uma era em que a IA se torna um assistente universal exige novas abordagens para avaliar o que realmente significa ser um especialista competente.
Quer parar de ler sobre IA e começar a usar?
AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.