Microsoft enseñó a Copilot Researcher a verificar respuestas de GPT y Claude en un único proceso
Microsoft ha comenzado a implementar el modo Critique en Copilot Researcher: ahora una respuesta de investigación puede ser preparada por GPT, con Claude…
Procesado por IA desde 3DNews AI; editado por Hamidun News
Microsoft ha comenzado a implementar un modo Critique en Copilot Researcher, en el que dos modelos trabajan simultáneamente en una única respuesta de investigación — GPT de OpenAI y Claude de Anthropic. En paralelo, la empresa ha lanzado el despliegue de un nuevo agente de IA, Copilot Cowork, demostrando que Copilot se está transformando cada vez más de un asistente único en un conjunto de asistentes coordinados.
Cómo Funciona Critique
El escenario Critique es simple: un modelo primero prepara un borrador de respuesta a la solicitud del usuario, y el segundo luego lo verifica en cuanto a precisión. En la primera fase, GPT responde, mientras que Claude actúa como revisor interno. Para un asistente de investigación, esto es más importante de lo que parece: en tareas de búsqueda, resumen y análisis, el desafío generalmente no es escribir rápidamente, sino detectar puntos débiles, imprecisiones en la redacción y conclusiones cuestionables antes de que el resultado llegue al usuario.
Microsoft ya está hablando del siguiente paso: quieren hacer el proceso bidireccional para que los modelos puedan intercambiar roles. Es decir, no solo Claude criticará la respuesta de GPT, sino que GPT también podrá revisar los borradores de Claude. Esencialmente, la empresa está armando un mini-proceso editorial dentro de un único flujo de trabajo, donde la generación y la verificación están separadas.
Este es un cambio notable para la IA corporativa: la apuesta no es solo en la fortaleza de un modelo único, sino en cómo se disputan, se verifican mutuamente y aumentan la confiabilidad de la respuesta final.
Por Qué Esto para Microsoft
Para Microsoft, esto también es una forma de transformar el hecho de tener modelos de diferentes proveedores en una ventaja práctica, en lugar de ser solo una larga lista de compatibilidades. Anteriormente, los enfoques multi-modelo a menudo sonaban como un plus formal: al cliente se le da una opción entre varios motores, pero cada tarea aún es realizada por uno de ellos. La lógica aquí es diferente — los modelos comienzan a trabajar juntos y cubren las debilidades del otro directamente dentro de un único escenario.
Este enfoque encaja especialmente bien con Microsoft 365, donde se espera que Copilot no sea un experimento, sino un resultado predecible en documentos, hojas de cálculo e investigaciones reales.
En la práctica, este enfoque proporciona varios beneficios tangibles.
"Los clientes deben recibir no un conjunto de modelos, sino el beneficio de su trabajo conjunto," — así es como
Microsoft describe la idea del nuevo modo.
- respuestas más cuidadosas a consultas de investigación gracias a una etapa separada de verificación
- menos dependencia de los puntos fuertes y débiles de un modelo específico
- un flujo de trabajo más comprensible donde la generación y la crítica se dividen por función
- una base para escenarios futuros donde múltiples modelos debaten entre sí antes de entregar resultados
Microsoft aún no promete la desaparición mágica de errores, y esta es la posición correcta. Un modelo verificando otro no garantiza automáticamente la verdad: ambos sistemas pueden cometer errores, estar de acuerdo con una premisa incorrecta o pasar por alto áreas problemáticas. Pero incluso este esquema ya es mejor que una respuesta única sin control interno, especialmente en productos donde el resultado luego va a la correspondencia de trabajo, presentaciones o notas analíticas en los flujos de trabajo de la empresa.
Cowork se Lanza en Paralelo
Al mismo tiempo, Microsoft ha comenzado a desplegar Copilot Cowork — otro agente de IA en el ecosistema Copilot. La nota original contiene pocos detalles sobre sus funciones, pero el timing en sí es importante: la empresa muestra no solo una característica local, sino una transición más amplia hacia un conjunto de agentes especializados y modos de operación.
Researcher maneja escenarios de investigación, Cowork expande la línea, y la combinación de diferentes modelos dentro de un único proceso sugiere hacia dónde irá Copilot después. Si antes un asistente corporativo era principalmente percibido como un único chatbot, ahora la arquitectura se está volviendo modular. Un agente puede recopilar material, otro verificarlo, un tercero ayudar con la colaboración del equipo. Para Microsoft, esta es una forma conveniente de escalar Copilot sin prometer un súper-agente universal que sea igualmente bueno en todo.
En cambio, la empresa está armando un sistema más práctico: roles separados, procesos separados y más control sobre la calidad de los resultados en cada etapa.
Qué Significa Esto
Microsoft está moviendo Copilot hacia un sistema de IA de múltiples pasos, donde la calidad de la respuesta aumenta no solo a través de un modelo más fuerte, sino a través de la verificación interna. Para el mercado, esta es una señal importante: la próxima competencia en IA corporativa se llevará a cabo no solo entre GPT, Claude y otros modelos, sino entre flujos de trabajo completos en los que estos modelos interactúan.
¿Quieres dejar de leer sobre IA y empezar a usarla?
AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.