Стартап Probably привлёк $9 млн, чтобы сделать ИИ таким же точным, как обычный код
Стартап с говорящим названием Probably поднял $9 млн на борьбу с галлюцинациями ИИ. Компания хочет создать систему, которая верифицирует каждый факт до его…
Processado por IA de TechCrunch; editado por Hamidun News
A startup americana Probably fechou uma rodada seed de US$ 9 milhões. Os fundos serão destinados ao desenvolvimento de sistemas de IA que evitam alucinações e erros factuais antes da resposta chegar ao usuário. O objetivo principal é alcançar uma precisão comparável à de sistemas determinísticos, ou seja, ao código comum de software.
Por que alucinações não são apenas um incômodo
Grandes modelos de linguagem regularmente "alucina": produzem com confiança fatos falsos, citam pesquisas inexistentes, inventam citações. De acordo com várias avaliações independentes, até mesmo os modelos comerciais mais avançados cometem erros em 10–20% das afirmações factuais específicas. Ao mesmo tempo, é extremamente difícil para os usuários determinar onde o modelo está certo e onde está inventando — ele soa igualmente confiante nos dois casos.
Isso cria um risco sistêmico que limita a aplicabilidade da IA em cenários reais de negócio. As empresas são forçadas a escolher entre duas opções ruins: contratar pessoas para verificar cada resposta de IA ou limitar o uso de modelos apenas para tarefas onde erros não são críticos. Para medicina, direito, conformidade financeira e setor público, isso efetivamente significa que sistemas de IA autônomos não são aplicáveis — o custo do erro é muito alto.
Novo padrão: precisão determinística
Probably está estabelecendo um padrão não trivial — alcançar a precisão de sistemas determinísticos. Isso é fundamentalmente diferente de como funcionam os LLMs atuais. Um programa determinístico sempre produz o mesmo resultado com os mesmos dados de entrada: uma calculadora nunca vai "decidir" inventar uma resposta para 2 + 2. Um modelo de linguagem funciona diferentemente: ele gera texto probabilístico que pode parecer convincente, mas não precisa ser verdadeiro. A equipe do Probably está construindo uma arquitetura onde a IA não apenas gera uma resposta, mas a verifica antes de enviar. Princípios-chave:
- Separação clara entre conhecimento confiável e pressupostos do modelo
- Verificação de cada afirmação factual antes que chegue ao usuário
- "Não sei" explícito em vez de fatos inventados
- Transparência: o sistema explica a origem de cada afirmação
- Tolerância zero para erros factuais na resposta final
Essa abordagem é oposta à utilizada na maioria dos desenvolvimentos de LLM nos últimos anos. Os modelos foram ajustados com ênfase em "utilidade" e "persuasão" — o que frequentemente entrava em conflito com a precisão.
Mercado e concorrência
A tarefa de uma IA confiável está atraindo ativamente capital de risco. Neste nicho, operam empresas como Vectara, Cohere com foco em arquiteturas RAG empresariais, vários startups em sigilo e projetos acadêmicos em grandes universidades. Os grandes players — OpenAI, Anthropic e Google — também estão investindo em reduzir alucinações, mas para eles a precisão é apenas uma de muitas características do produto, não o diferenciador principal.
O Probably constrói tudo em torno de uma ideia. A rodada seed de US$ 9 milhões dá ao time de um ano e meio a dois anos para provar a viabilidade da arquitetura e atrair o próximo financiamento. O nome da empresa é uma ironia deliberada sobre a natureza probabilística dos modelos de linguagem e ao mesmo tempo uma declaração de intenção de superá-la.
O que isso significa
Se o Probably conseguir resolver de forma convincente o problema das alucinações, isso abrirá caminho para a IA em indústrias regulamentadas — saúde, serviços jurídicos, conformidade financeira — onde hoje sistemas autônomos são inaceitáveis pela imprecisão. Para os negócios, isso significa a possibilidade de eliminar a cara camada de verificação humana e realmente delegar tarefas críticas às máquinas — não em palavras, mas com garantias mensuráveis de precisão.
Precisa de IA funcionando dentro da sua empresa — não só no feed de notícias?
Eu construo IA em produção para empresas — CRM sob medida, ferramentas internas, agentes autônomos, automação de processos. Pertence a você, moldada ao seu processo, sem taxa por usuário. Feito por Zhemal Khamidun, CPO da AlpinaGPT (plataforma de IA, 6.000+ usuários).
O essencial da IA — uma vez por semana
Sete histórias que realmente importaram, escolhidas a dedo. Sem ruído nem releases.
Pronto! Verifique seu e-mail para a confirmação.