DSGym: framework para treinar agentes de ciência de dados em 90+ tarefas científicas
A Together AI publicou o DSGym, um framework unificado para treinar e avaliar agentes LLM que executam tarefas de ciência de dados. Ele reúne 90+ tarefas de bio

◐ Ouvir artigo
A Together AI publicou o DSGym, um framework unificado para treinar e avaliar agentes LLM que executam tarefas de ciência de dados. Ele reúne 90+ tarefas de bioinformática da literatura científica e 92 competições do Kaggle. Um modelo 4B foi treinado em dados sintéticos e obteve resultados SOTA entre as soluções open-source. O problema é que os benchmarks existentes são incompatíveis e não exigem análise real de dados.