TechCrunch→ original

Стартап Probably привлёк $9 млн, чтобы сделать ИИ таким же точным, как обычный код

Стартап с говорящим названием Probably поднял $9 млн на борьбу с галлюцинациями ИИ. Компания хочет создать систему, которая верифицирует каждый факт до его…

Procesado por IA desde TechCrunch; editado por Hamidun News
Стартап Probably привлёк $9 млн, чтобы сделать ИИ таким же точным, как обычный код
Fuente: TechCrunch. Collage: Hamidun News.
◐ Escuchar artículo

La startup estadounidense Probably ha cerrado una ronda semilla de $9 millones. Los fondos se destinarán al desarrollo de sistemas de IA que eviten alucinaciones y errores fácticos antes de que la respuesta llegue al usuario. El objetivo principal es lograr una precisión comparable a la de los sistemas determinísticos, es decir, al código de software común.

Por qué las alucinaciones no son solo una molestia

Los grandes modelos de lenguaje "alucinan" regularmente: producen con confianza hechos falsos, citan investigaciones inexistentes, inventan citas. Según varias evaluaciones independientes, incluso los modelos comerciales más avanzados cometen errores en el 10–20% de afirmaciones fácticas específicas. Al mismo tiempo, es extremadamente difícil para los usuarios determinar dónde el modelo tiene razón y dónde está inventando — suena igualmente confiado en ambos casos.

Esto crea un riesgo sistémico que limita la aplicabilidad de la IA en escenarios comerciales reales. Las empresas se ven obligadas a elegir entre dos opciones malas: contratar personas para verificar cada respuesta de IA o limitar el uso de modelos solo a tareas donde los errores no son críticos. Para la medicina, el derecho, el cumplimiento financiero y el sector público, esto efectivamente significa que los sistemas de IA autónomos no son aplicables — el costo del error es demasiado alto.

Nuevo estándar: precisión determinística

Probably está estableciendo un estándar no trivial — lograr la precisión de sistemas determinísticos. Esto es fundamentalmente diferente de cómo funcionan los LLMs actuales. Un programa determinístico siempre produce el mismo resultado con los mismos datos de entrada: una calculadora nunca va a "decidir" inventar una respuesta a 2 + 2. Un modelo de lenguaje funciona de forma diferente: genera texto probabilístico que puede sonar convincente pero no tiene que ser verdadero. El equipo de Probably está construyendo una arquitectura donde la IA no solo genera una respuesta, sino que la verifica antes de enviarla. Principios clave:

  • Separación clara entre conocimiento confiable y suposiciones del modelo
  • Verificación de cada afirmación fáctica antes de que llegue al usuario
  • "No sé" explícito en lugar de hechos inventados
  • Transparencia: el sistema explica la fuente de cada afirmación
  • Tolerancia cero para errores fácticos en la respuesta final

Este enfoque es opuesto al utilizado en la mayoría de los desarrollos de LLM en los últimos años. Los modelos se ajustaron con énfasis en "utilidad" y "persuasividad" — lo que frecuentemente entraba en conflicto con la precisión.

Mercado y competencia

La tarea de crear una IA confiable está atrayendo activamente capital de riesgo. En este nicho operan empresas como Vectara, Cohere con enfoque en arquitecturas RAG empresariales, varios startups en sigilo y proyectos académicos en universidades importantes. Los grandes jugadores — OpenAI, Anthropic y Google — también están invirtiendo en reducir alucinaciones, pero para ellos la precisión es solo una de muchas características del producto, no el diferenciador principal.

Probably construye todo alrededor de una idea. La ronda semilla de $9 millones le da al equipo entre un año y medio a dos años para probar la viabilidad de la arquitectura y atraer la siguiente financiación. El nombre de la empresa es una ironía deliberada sobre la naturaleza probabilística de los modelos de lenguaje y al mismo tiempo una declaración de intención de superarla.

Qué significa esto

Si Probably logra resolver de manera convincente el problema de las alucinaciones, abrirá el camino para la IA en industrias reguladas — salud, servicios legales, cumplimiento financiero — donde hoy los sistemas autónomos son inaceptables por su falta de precisión. Para los negocios, esto significa la capacidad de eliminar la costosa capa de verificación humana y realmente delegar tareas críticas a las máquinas — no en palabras, sino con garantías medibles de precisión.

ZK
Hamidun News
Noticias de AI sin ruido. Selección editorial diaria de más de 400 fuentes. Producto de Zhemal Khamidun, Head of AI en Alpina Digital.

¿Necesitas IA funcionando dentro de tu empresa — no solo en tu feed de noticias?

Construyo IA en producción para empresas — CRM a medida, herramientas internas, agentes autónomos, automatización de procesos. Tuya, adaptada a tu proceso, sin coste por usuario. Creado por Zhemal Khamidun, CPO de AlpinaGPT (plataforma de IA, 6.000+ usuarios).

¿Qué te parece?
Cargando comentarios…