Startup Memvid procura "bully de IA": $800 por dia para flagrar chatbots com erros
Memvid da Califórnia está procurando um "bully de IA" — alguém que passará oito horas seguidas discutindo com chatbots populares e flagrando falhas de…
Processado por IA de Guardian; editado por Hamidun News
A startup californiana Memvid publicou uma vaga de emprego que parece uma brincadeira, mas resolve um problema muito real da indústria. A empresa está disposta a pagar $800 por um dia de trabalho para uma pessoa que deliberadamente estressará chatbots populares e documentará onde eles perdem contexto, ficam confusos e começam a inventar coisas.
A Descrição da Vaga
De acordo com a descrição da função, o futuro funcionário passará oito horas seguidas se comunicando com os principais chatbots e será extremamente rigoroso com eles. O ponto não é toxicidade pela toxicidade em si, mas criar deliberadamente cenários desconfortáveis para o modelo: voltar a tópicos antigos, repetir as mesmas perguntas, identificar contradições e exigir o reconhecimento de erros. Essencialmente, é um teste de estresse manual que verifica não a velocidade das respostas, mas a confiabilidade da memória e a capacidade de manter uma longa conversa sem falhas.
- fazer a mesma pergunta repetidamente em diferentes formulações
- trazer o bot de volta a algo que ele disse vários mensagens atrás
- identificar contradições, substituições de fatos e invenções confiantes
- registrar todas as falhas e a reação do modelo para análise posterior
Para a posição, você não precisa de diploma de programador ou experiência trabalhando em uma equipe de IA. A Memvid afirma diretamente que o principal ponto positivo seria "experiência pessoal extensiva com decepções tecnológicas" e paciência para repetidamente buscar uma resposta coerente. A empresa procura alguém que não desista após a primeira resposta bonita mas incorreta.
De acordo com o fundador, as candidaturas já estão chegando de profissionais do conhecimento — pessoas que confiam em serviços de IA todos os dias e são especialmente rápidas em notar quando eles começam a esquecer o contexto.
Por Que a Memvid Precisa Disso
O cofundador e CEO da Memvid, Mohamed Omar, explica a ideia de forma simples: quase todo o valor da IA conversacional repousa na memória. Se um sistema não conseguir lembrar confiavelmente do que você falou um minuto atrás, ele começa a mascarar lacunas com respostas plausíveis mas incorretas.
De acordo com ele, ainda em 2024, a empresa enfrentou o fato de que as soluções de memória disponíveis no mercado funcionavam de forma instável, o que significa que qualquer diálogo longo corria o risco de se transformar em um conjunto de suposições em algum momento.
"Memória para IA é o
Santo Graal," é assim que Omar descreve o principal gargalo dos chatbots modernos.
É daí que vem esta vaga de emprego: a Memvid quer transformar a frustração comum do usuário em uma métrica observável. Um candidato, conforme Omar relatou, gasta cerca de $300 por mês em assinaturas para várias plataformas de IA e encontrou problemas de memória em literalmente todos os serviços.
Para a startup, este é um sinal importante: bugs de contexto não são mais considerados um caso extremo raro. Eles ocorrem em pessoas que confiam em chatbots para trabalho real, não apenas experimentando com eles à noite.
O Problema É Mais Amplo
A história do "AI bully" parece viral, mas é baseada em um contexto mais amplo. O artigo cita um trabalho revisado por pares apresentado no ICLR em 2025: até mesmo os principais sistemas de IA comerciais perderam 30% a 60% de precisão quando obrigados a manter fatos durante um diálogo longo. Em outras palavras, um modelo pode responder brilhantemente consultas individuais, mas enfraquece notavelmente quando a conversa se torna uma cadeia de etapas dependentes.
Estes são precisamente os cenários em que a IA está sendo cada vez mais usada no trabalho.
As consequências já vão além de uma interface inconveniente. Em março, o laboratório Irregular demonstrou que agentes de IA em um ambiente corporativo simulado poderiam contornar restrições protetoras, interagir com dados sensíveis e realizar ações potencialmente prejudiciais até mesmo sem comandos diretos.
No campo jurídico, de acordo com o pesquisador Damien Charloton, o número de alucinações de IA em documentos cresceu de aproximadamente dois casos por semana para dois a três por dia até o outono de 2025. O Instituto ECRI incluiu os riscos do diagnóstico de IA entre as principais ameaças à segurança do paciente para 2026.
O Que Significa
A vaga inusitada da Memvid mostra uma mudança importante: o mercado está começando a medir a qualidade da IA não por demos e não por benchmarks, mas por como o modelo se comporta em um fluxo de trabalho real longo, frustrante e desigual. Se os chatbots estão se tornando uma ferramenta de trabalho para analistas, advogados, médicos e equipes de escritório, então memória, consistência e a capacidade de honestamente admitir erros se transformam de bônus agradáveis em requisitos obrigatórios do produto.
Quer parar de ler sobre IA e começar a usar?
AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.