Guardian→ original

Startup Memvid procura "bully de IA": $800 por dia para flagrar chatbots com erros

Memvid da Califórnia está procurando um "bully de IA" — alguém que passará oito horas seguidas discutindo com chatbots populares e flagrando falhas de…

Processado por IA de Guardian; editado por Hamidun News
Startup Memvid procura "bully de IA": $800 por dia para flagrar chatbots com erros
Fonte: Guardian. Colagem: Hamidun News.
◐ Ouvir artigo

A startup californiana Memvid publicou uma vaga de emprego que parece uma brincadeira, mas resolve um problema muito real da indústria. A empresa está disposta a pagar $800 por um dia de trabalho para uma pessoa que deliberadamente estressará chatbots populares e documentará onde eles perdem contexto, ficam confusos e começam a inventar coisas.

A Descrição da Vaga

De acordo com a descrição da função, o futuro funcionário passará oito horas seguidas se comunicando com os principais chatbots e será extremamente rigoroso com eles. O ponto não é toxicidade pela toxicidade em si, mas criar deliberadamente cenários desconfortáveis para o modelo: voltar a tópicos antigos, repetir as mesmas perguntas, identificar contradições e exigir o reconhecimento de erros. Essencialmente, é um teste de estresse manual que verifica não a velocidade das respostas, mas a confiabilidade da memória e a capacidade de manter uma longa conversa sem falhas.

  • fazer a mesma pergunta repetidamente em diferentes formulações
  • trazer o bot de volta a algo que ele disse vários mensagens atrás
  • identificar contradições, substituições de fatos e invenções confiantes
  • registrar todas as falhas e a reação do modelo para análise posterior

Para a posição, você não precisa de diploma de programador ou experiência trabalhando em uma equipe de IA. A Memvid afirma diretamente que o principal ponto positivo seria "experiência pessoal extensiva com decepções tecnológicas" e paciência para repetidamente buscar uma resposta coerente. A empresa procura alguém que não desista após a primeira resposta bonita mas incorreta.

De acordo com o fundador, as candidaturas já estão chegando de profissionais do conhecimento — pessoas que confiam em serviços de IA todos os dias e são especialmente rápidas em notar quando eles começam a esquecer o contexto.

Por Que a Memvid Precisa Disso

O cofundador e CEO da Memvid, Mohamed Omar, explica a ideia de forma simples: quase todo o valor da IA conversacional repousa na memória. Se um sistema não conseguir lembrar confiavel­mente do que você falou um minuto atrás, ele começa a mascarar lacunas com respostas plausíveis mas incorretas.

De acordo com ele, ainda em 2024, a empresa enfrentou o fato de que as soluções de memória disponíveis no mercado funcionavam de forma instável, o que significa que qualquer diálogo longo corria o risco de se transformar em um conjunto de suposições em algum momento.

"Memória para IA é o

Santo Graal," é assim que Omar descreve o principal gargalo dos chatbots modernos.

É daí que vem esta vaga de emprego: a Memvid quer transformar a frustração comum do usuário em uma métrica observável. Um candidato, conforme Omar relatou, gasta cerca de $300 por mês em assinaturas para várias plataformas de IA e encontrou problemas de memória em literalmente todos os serviços.

Para a startup, este é um sinal importante: bugs de contexto não são mais considerados um caso extremo raro. Eles ocorrem em pessoas que confiam em chatbots para trabalho real, não apenas experimentando com eles à noite.

O Problema É Mais Amplo

A história do "AI bully" parece viral, mas é baseada em um contexto mais amplo. O artigo cita um trabalho revisado por pares apresentado no ICLR em 2025: até mesmo os principais sistemas de IA comerciais perderam 30% a 60% de precisão quando obrigados a manter fatos durante um diálogo longo. Em outras palavras, um modelo pode responder brilhantemente consultas individuais, mas enfraquece notavelmente quando a conversa se torna uma cadeia de etapas dependentes.

Estes são precisamente os cenários em que a IA está sendo cada vez mais usada no trabalho.

As consequências já vão além de uma interface inconveniente. Em março, o laboratório Irregular demonstrou que agentes de IA em um ambiente corporativo simulado poderiam contornar restrições protetoras, interagir com dados sensíveis e realizar ações potencialmente prejudiciais até mesmo sem comandos diretos.

No campo jurídico, de acordo com o pesquisador Damien Charloton, o número de alucinações de IA em documentos cresceu de aproximadamente dois casos por semana para dois a três por dia até o outono de 2025. O Instituto ECRI incluiu os riscos do diagnóstico de IA entre as principais ameaças à segurança do paciente para 2026.

O Que Significa

A vaga inusitada da Memvid mostra uma mudança importante: o mercado está começando a medir a qualidade da IA não por demos e não por benchmarks, mas por como o modelo se comporta em um fluxo de trabalho real longo, frustrante e desigual. Se os chatbots estão se tornando uma ferramenta de trabalho para analistas, advogados, médicos e equipes de escritório, então memória, consistência e a capacidade de honestamente admitir erros se transformam de bônus agradáveis em requisitos obrigatórios do produto.

ZK
Hamidun News
Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Quer parar de ler sobre IA e começar a usar?

AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.

O que você acha?
Carregando comentários…