TechCrunch→ original

Стартап Probably привлёк $9 млн, чтобы сделать ИИ таким же точным, как обычный код

Стартап с говорящим названием Probably поднял $9 млн на борьбу с галлюцинациями ИИ. Компания хочет создать систему, которая верифицирует каждый факт до его…

Processado por IA de TechCrunch; editado por Hamidun News
Стартап Probably привлёк $9 млн, чтобы сделать ИИ таким же точным, как обычный код
Fonte: TechCrunch. Colagem: Hamidun News.
◐ Ouvir artigo

A startup americana Probably fechou uma rodada seed de US$ 9 milhões. Os fundos serão destinados ao desenvolvimento de sistemas de IA que evitam alucinações e erros factuais antes da resposta chegar ao usuário. O objetivo principal é alcançar uma precisão comparável à de sistemas determinísticos, ou seja, ao código comum de software.

Por que alucinações não são apenas um incômodo

Grandes modelos de linguagem regularmente "alucina": produzem com confiança fatos falsos, citam pesquisas inexistentes, inventam citações. De acordo com várias avaliações independentes, até mesmo os modelos comerciais mais avançados cometem erros em 10–20% das afirmações factuais específicas. Ao mesmo tempo, é extremamente difícil para os usuários determinar onde o modelo está certo e onde está inventando — ele soa igualmente confiante nos dois casos.

Isso cria um risco sistêmico que limita a aplicabilidade da IA em cenários reais de negócio. As empresas são forçadas a escolher entre duas opções ruins: contratar pessoas para verificar cada resposta de IA ou limitar o uso de modelos apenas para tarefas onde erros não são críticos. Para medicina, direito, conformidade financeira e setor público, isso efetivamente significa que sistemas de IA autônomos não são aplicáveis — o custo do erro é muito alto.

Novo padrão: precisão determinística

Probably está estabelecendo um padrão não trivial — alcançar a precisão de sistemas determinísticos. Isso é fundamentalmente diferente de como funcionam os LLMs atuais. Um programa determinístico sempre produz o mesmo resultado com os mesmos dados de entrada: uma calculadora nunca vai "decidir" inventar uma resposta para 2 + 2. Um modelo de linguagem funciona diferentemente: ele gera texto probabilístico que pode parecer convincente, mas não precisa ser verdadeiro. A equipe do Probably está construindo uma arquitetura onde a IA não apenas gera uma resposta, mas a verifica antes de enviar. Princípios-chave:

  • Separação clara entre conhecimento confiável e pressupostos do modelo
  • Verificação de cada afirmação factual antes que chegue ao usuário
  • "Não sei" explícito em vez de fatos inventados
  • Transparência: o sistema explica a origem de cada afirmação
  • Tolerância zero para erros factuais na resposta final

Essa abordagem é oposta à utilizada na maioria dos desenvolvimentos de LLM nos últimos anos. Os modelos foram ajustados com ênfase em "utilidade" e "persuasão" — o que frequentemente entrava em conflito com a precisão.

Mercado e concorrência

A tarefa de uma IA confiável está atraindo ativamente capital de risco. Neste nicho, operam empresas como Vectara, Cohere com foco em arquiteturas RAG empresariais, vários startups em sigilo e projetos acadêmicos em grandes universidades. Os grandes players — OpenAI, Anthropic e Google — também estão investindo em reduzir alucinações, mas para eles a precisão é apenas uma de muitas características do produto, não o diferenciador principal.

O Probably constrói tudo em torno de uma ideia. A rodada seed de US$ 9 milhões dá ao time de um ano e meio a dois anos para provar a viabilidade da arquitetura e atrair o próximo financiamento. O nome da empresa é uma ironia deliberada sobre a natureza probabilística dos modelos de linguagem e ao mesmo tempo uma declaração de intenção de superá-la.

O que isso significa

Se o Probably conseguir resolver de forma convincente o problema das alucinações, isso abrirá caminho para a IA em indústrias regulamentadas — saúde, serviços jurídicos, conformidade financeira — onde hoje sistemas autônomos são inaceitáveis pela imprecisão. Para os negócios, isso significa a possibilidade de eliminar a cara camada de verificação humana e realmente delegar tarefas críticas às máquinas — não em palavras, mas com garantias mensuráveis de precisão.

ZK
Hamidun News
Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Precisa de IA funcionando dentro da sua empresa — não só no feed de notícias?

Eu construo IA em produção para empresas — CRM sob medida, ferramentas internas, agentes autônomos, automação de processos. Pertence a você, moldada ao seu processo, sem taxa por usuário. Feito por Zhemal Khamidun, CPO da AlpinaGPT (plataforma de IA, 6.000+ usuários).

O que você acha?
Carregando comentários…