CollectivIQ quiere hacer que la AI sea más fiable consultando 14 modelos a la vez
La startup CollectivIQ propone un nuevo enfoque para la fiabilidad de las respuestas de AI: en lugar de un solo chatbot, el sistema consulta simultáneamente…
Procesado por IA desde TechCrunch; editado por Hamidun News
El problema de las alucinaciones en los modelos de lenguaje sigue siendo una de las principales barreras para la confianza masiva en la inteligencia artificial. Cualquiera que haya recibido de ChatGPT información presentada con confianza pero completamente fabricada, sabe esa sensación: la tecnología impresiona, pero confiar en ella ciegamente es peligroso. La startup CollectivIQ decidió atacar este problema desde un ángulo inesperado — no mejorando un único modelo, sino consultando catorce simultáneamente.
La idea, que TechCrunch informó, es elegante en su simplicidad. CollectivIQ agrega respuestas de ChatGPT, Gemini, Claude, Grok y hasta diez otros modelos de lenguaje al mismo tiempo. Un usuario introduce una consulta una vez y recibe un panorama de respuestas, donde puede comparar formulaciones, identificar puntos de acuerdo y, lo que es más importante, notar desacuerdos. Si trece de catorce modelos dicen una cosa y uno dice otra, esa es una señal poderosa. Si los modelos están en desacuerdo por igual, eso también es información valiosa: significa que la pregunta es más compleja de lo que parece, y confiar ciegamente en cualquier respuesta individual no vale la pena.
Para entender por qué este enfoque podría funcionar, vale la pena recordar un fenómeno que la teoría de la decisión llama la "sabiduría de la multitud". Francis Galton descubrió en 1906 que la evaluación promedio de un gran grupo de personas es más precisa que la opinión de cualquier experto individual. CollectivIQ esencialmente transfiere este principio al mundo de los grandes modelos de lenguaje.
Cada uno de ellos se entrena con datos diferentes, con énfasis y limitaciones diferentes. GPT-4o es fuerte en razonamiento, Claude — en precisión y seguimiento de instrucciones, Gemini — en multimodalidad y trabajo con información actual, Grok — en tono informal y acceso a datos de redes sociales. Cuando sus respuestas se combinan, las debilidades de un modelo se compensan con las fortalezas de otro.
Técnicamente, implementar tal servicio plantea varias preguntas serias. En primer lugar — costo. Cada solicitud a una API comercial cuesta tokens, y multiplicando por catorce, convierte céntimos en sumas notables.
Para un usuario común que pregunta una receta de borscht, esto es excesivo. Pero para profesionales — abogados, médicos, analistas, periodistas — para quienes la precisión es crítica, la economía podría funcionar. La segunda pregunta es velocidad.
Las solicitudes paralelas a diferentes API tienen diferentes tiempos de respuesta, y el usuario tendrá que esperar al modelo más lento o recibir respuestas de forma asincrónica, conforme lleguen. La tercera es el diseño de la interfaz. Presentar catorce respuestas de forma que una persona no se pierda en la información sino que extraiga rápidamente la esencia — esa es una tarea de diseño seria.
CollectivIQ no aparece en el vacío. El mercado ya tiene metabuscadores de modelos de IA: Poe de Quora proporciona acceso a varios modelos en una única interfaz, y servicios como TypingMind y OpenRouter permiten cambiar entre proveedores. Pero ninguno de ellos está apostando por la comparación simultánea como herramienta de verificación. CollectivIQ posiciona la multimodalidad no como conveniencia, sino como un método para aumentar la confiabilidad — y ese es un narrativa fundamentalmente diferente. En lugar de "elige el mejor modelo" — "no confíes en ninguno, compara todos".
Hay también un contexto más profundo. La industria de la inteligencia artificial está experimentando una crisis de confianza. La investigación muestra que los usuarios son cada vez más escépticos respecto a las respuestas de los chatbots, pero continúan usándolos — simplemente porque no hay alternativas. CollectivIQ ofrece una solución intermedia: no obliga a confiar ciegamente y no requiere abandonar la IA, sino que da una herramienta para análisis crítico. En cierto sentido, esto es un retorno al principio periodístico de verificación cruzada de fuentes, excepto que las fuentes son redes neuronales.
La pregunta principal es si este modelo escala. Si los grandes proveedores comienzan a restringir el acceso a la API para agregadores o suben los precios, el negocio de CollectivIQ estará amenazado. Además, conforme los modelos se vuelven cada vez más similares entre sí, aprendiendo de conjuntos de datos superpuestos, el valor de la comparación multimodelo puede disminuir. Pero mientras la diversidad de enfoques se mantenga, la idea de crowdsourcing entre IAs se ve simultáneamente ingeniosa y práctica. Quizás el futuro de la inteligencia artificial confiable no sea un modelo perfecto, sino un coro de imperfectos, donde una nota falsa se escucha inmediatamente.
¿Quieres dejar de leer sobre IA y empezar a usarla?
AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.