Стартап Probably привлёк $9 млн, чтобы сделать ИИ таким же точным, как обычный код
Стартап с говорящим названием Probably поднял $9 млн на борьбу с галлюцинациями ИИ. Компания хочет создать систему, которая верифицирует каждый факт до его…
Traité par IA depuis TechCrunch ; édité par Hamidun News
La startup américaine Probably a clôturé un tour de semences de 9 millions de dollars. Les fonds seront destinés au développement de systèmes d'IA qui préviennent les hallucinations et les erreurs factuelles avant que la réponse n'atteigne l'utilisateur. L'objectif principal est d'atteindre une précision comparable à celle des systèmes déterministes, c'est-à-dire au code logiciel ordinaire.
Pourquoi les hallucinations ne sont pas qu'un désagrément
Les grands modèles de langage « hallucinent » régulièrement : ils produisent avec assurance des faits faux, citent des recherches inexistantes, inventent des citations. Selon diverses évaluations indépendantes, même les modèles commerciaux les plus avancés commettent des erreurs sur 10–20% des affirmations factuelles spécifiques. En même temps, il est extrêmement difficile pour les utilisateurs de déterminer où le modèle a raison et où il invente — il semble aussi confiant dans les deux cas.
Cela crée un risque systémique qui limite l'applicabilité de l'IA dans les scénarios commerciaux réels. Les entreprises sont forcées de choisir entre deux mauvaises options : embaucher des personnes pour vérifier chaque réponse d'IA ou limiter l'utilisation des modèles uniquement aux tâches où les erreurs ne sont pas critiques. Pour la médecine, le droit, la conformité financière et le secteur public, cela signifie effectivement que les systèmes d'IA autonomes ne sont pas applicables — le coût de l'erreur est trop élevé.
Nouveau référentiel : précision déterministe
Probably établit un référentiel non trivial — atteindre la précision des systèmes déterministes. C'est fondamentalement différent de la façon dont fonctionnent les LLMs actuels. Un programme déterministe produit toujours le même résultat avec les mêmes données d'entrée : une calculatrice ne va jamais « décider » d'inventer une réponse à 2 + 2. Un modèle de langage fonctionne différemment : il génère du texte probabiliste qui peut sembler convaincant mais ne doit pas nécessairement être vrai. L'équipe de Probably construit une architecture où l'IA ne se contente pas de générer une réponse, mais la vérifie avant de l'envoyer. Principes clés :
- Séparation claire entre les connaissances fiables et les hypothèses du modèle
- Vérification de chaque affirmation factuelle avant qu'elle n'atteigne l'utilisateur
- « Je ne sais pas » explicite au lieu de faits inventés
- Transparence : le système explique la source de chaque affirmation
- Zéro tolérance pour les erreurs factuelles dans la réponse finale
Cette approche est inverse à celle utilisée dans la plupart des développements de LLM ces dernières années. Les modèles ont été affinés en mettant l'accent sur « l'utilité » et la « persuasivité » — ce qui entrait souvent en conflit avec la précision.
Marché et concurrence
La tâche de créer une IA fiable attire activement les capitaux-risqueurs. Dans ce créneau opèrent des entreprises comme Vectara, Cohere axées sur les architectures RAG d'entreprise, plusieurs startups en mode furtif et des projets académiques dans de grandes universités. Les grands acteurs — OpenAI, Anthropic et Google — investissent également dans la réduction des hallucinations, mais pour eux la précision est l'une des nombreuses caractéristiques du produit, pas le principal différenciateur.
Probably construit tout autour d'une idée. Le tour de semences de 9 millions de dollars donne à l'équipe un an et demi à deux ans pour prouver la viabilité de l'architecture et attirer le prochain financement. Le nom de l'entreprise est une ironie délibérée sur la nature probabiliste des modèles de langage et en même temps une déclaration d'intention de la surmonter.
Ce que cela signifie
Si Probably parvient à résoudre de manière convaincante le problème des hallucinations, cela ouvrira la voie à l'IA dans les secteurs réglementés — santé, services juridiques, conformité financière — où aujourd'hui les systèmes autonomes sont inacceptables en raison de l'imprécision. Pour les entreprises, cela signifie la capacité d'éliminer la couche coûteuse de vérification humaine et de réellement déléguer des tâches critiques aux machines — pas en paroles, mais avec des garanties mesurables de précision.
Besoin d'une IA qui travaille dans votre entreprise — pas seulement dans votre fil d'actualité?
Je construis de l'IA en production pour les entreprises — CRM sur mesure, outils internes, agents autonomes, automatisation des processus. Vous en êtes propriétaire, adaptée à votre processus, sans coût par utilisateur. Réalisé par Zhemal Khamidun, CPO d'AlpinaGPT (plateforme IA, 6 000+ utilisateurs).
L'essentiel de l'IA — une fois par semaine
Sept actus qui ont vraiment compté, choisies à la main. Sans bruit ni communiqués.
C'est fait ! Vérifiez votre boîte mail pour la confirmation.