DiffQuant otimiza diretamente o índice de Sharpe por meio de um simulador de trading diferenciável
A maioria dos modelos de ML para trading aprende a reduzir o MSE, mas é avaliada pelo índice de Sharpe — são tarefas diferentes. O DiffQuant elimina essa…
Processado por IA de Habr AI; editado por Hamidun News
DiffQuant — um protótipo de código aberto que elimina uma contradição fundamental em trading de ML: modelos aprendem a minimizar o erro quadrático médio, mas são avaliados pela razão de Sharpe. Os autores fecharam essa lacuna tornando todo o pipeline de trading — desde features até PnL e comissões — um único grafo computacional diferenciável.
Problema das Metas Substituas
Na maioria dos sistemas de ML para trading quantitativo, o esquema é assim: treinar uma rede neural para prever retornos ou direção de preço, minimizando MSE ou BCE. Então, sobre essas previsões, construir uma estratégia de trading e avaliá-la pela razão de Sharpe — a razão entre retorno médio e volatilidade. O problema: esses dois objetivos são matematicamente não relacionados.
Melhor MSE não garante melhor Sharpe. Na prática, a rede neural gasta recursos reduzindo erro de previsão em regimes de mercado onde isso não impacta o resultado final do trading. Uma melhoria de 15% na precisão da previsão pode não gerar nenhum ganho de Sharpe — e este é um problema documentado tanto em trabalhos acadêmicos quanto entre profissionais da indústria quantitativa.
Soluções parciais — funções de perda de ranking, métricas proxy personalizadas, ponderação post-hoc — não resolvem o cerne da questão: o gradiente durante o treinamento não enxerga a mecânica real de trading.
Como o Simulador Diferenciável Funciona
DiffQuant resolve o problema diretamente: todo o pipeline de trading é implementado como um único grafo computacional com operações contínuas:
- Features de mercado → bloco de rede neural de previsão de sinal
- Sinal → posição alvo levando em conta restrições de tamanho e direção
- Posição → PnL passo a passo com modelo explícito de slippage e comissões
- PnL acumulado → razão de Sharpe como função de perda escalar diferenciável
O desafio técnico-chave é tornar o posicionamento e custos diferenciáveis, já que operações de trading reais são discretas. Os autores usam aproximações suaves: em vez de transições abruptas entre posições — funções contínuas suficientemente precisas para passagem de gradiente.
"Isto não é um sistema de trading pronto — é uma formulação diferente
do problema," enfatizam os autores.
Como resultado: o gradiente em relação à razão de Sharpe se propaga para trás através de todo o pipeline até os pesos da rede neural. O modelo treina diretamente no critério pelo qual será avaliado em produção.
Sharpe +1.73 e +1.15 Após Comissões
O protótipo foi testado em dois trimestres consecutivos held-out — períodos que o modelo não viu durante treinamento ou ajuste de hiperparâmetros. Sharpe +1.73 no primeiro trimestre e +1.15 no segundo após considerar comissões reais. Ambos os valores excedem um — o benchmark baseline aceito para estratégias algorítmicas. O código, dados e protocolo completo do experimento foram publicados em acesso aberto. Qualquer um com acesso a dados de mercado similares pode reproduzir os resultados. Os autores deliberadamente evitaram complexidade — nenhuma arquitetura exótica ou features não padrão: apenas uma mudança na função de perda.
O Que Isso Significa
DiffQuant demonstra que formulação correta do problema importa mais que escolha de arquitetura. Se uma estratégia em produção é avaliada por Sharpe — otimização durante treinamento deve almejar precisamente isso, não substitutos. Para fundos quants e pesquisadores independentes, este é um sinal prático: o gap entre objetivo de treinamento e métrica real pode ser fechado tecnicamente — e isso muda não apenas o resultado, mas também o que o modelo aprende.
Quer parar de ler sobre IA e começar a usar?
AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.