DSGym: framework para entrenar agentes de ciencia de datos en 90+ tareas científicas
Together AI publicó DSGym, un framework unificado para entrenar y evaluar agentes LLM que realizan tareas de ciencia de datos. Reúne 90+ tareas de bioinformátic

◐ Escuchar artículo
Together AI publicó DSGym, un framework unificado para entrenar y evaluar agentes LLM que realizan tareas de ciencia de datos. Reúne 90+ tareas de bioinformática de la literatura científica y 92 competiciones de Kaggle. Un modelo 4B fue entrenado con datos sintéticos y logró resultados SOTA entre las soluciones open-source. El problema es que los benchmarks existentes son incompatibles y no requieren un análisis real de datos.