Habr AI→ original

DiffQuant otimiza diretamente o índice de Sharpe por meio de um simulador de trading diferenciável

A maioria dos modelos de ML para trading aprende a reduzir o MSE, mas é avaliada pelo índice de Sharpe — são tarefas diferentes. O DiffQuant elimina essa…

Processado por IA de Habr AI; editado por Hamidun News
DiffQuant otimiza diretamente o índice de Sharpe por meio de um simulador de trading diferenciável
Fonte: Habr AI. Colagem: Hamidun News.
◐ Ouvir artigo

DiffQuant — um protótipo de código aberto que elimina uma contradição fundamental em trading de ML: modelos aprendem a minimizar o erro quadrático médio, mas são avaliados pela razão de Sharpe. Os autores fecharam essa lacuna tornando todo o pipeline de trading — desde features até PnL e comissões — um único grafo computacional diferenciável.

Problema das Metas Substituas

Na maioria dos sistemas de ML para trading quantitativo, o esquema é assim: treinar uma rede neural para prever retornos ou direção de preço, minimizando MSE ou BCE. Então, sobre essas previsões, construir uma estratégia de trading e avaliá-la pela razão de Sharpe — a razão entre retorno médio e volatilidade. O problema: esses dois objetivos são matematicamente não relacionados.

Melhor MSE não garante melhor Sharpe. Na prática, a rede neural gasta recursos reduzindo erro de previsão em regimes de mercado onde isso não impacta o resultado final do trading. Uma melhoria de 15% na precisão da previsão pode não gerar nenhum ganho de Sharpe — e este é um problema documentado tanto em trabalhos acadêmicos quanto entre profissionais da indústria quantitativa.

Soluções parciais — funções de perda de ranking, métricas proxy personalizadas, ponderação post-hoc — não resolvem o cerne da questão: o gradiente durante o treinamento não enxerga a mecânica real de trading.

Como o Simulador Diferenciável Funciona

DiffQuant resolve o problema diretamente: todo o pipeline de trading é implementado como um único grafo computacional com operações contínuas:

  • Features de mercado → bloco de rede neural de previsão de sinal
  • Sinal → posição alvo levando em conta restrições de tamanho e direção
  • Posição → PnL passo a passo com modelo explícito de slippage e comissões
  • PnL acumulado → razão de Sharpe como função de perda escalar diferenciável

O desafio técnico-chave é tornar o posicionamento e custos diferenciáveis, já que operações de trading reais são discretas. Os autores usam aproximações suaves: em vez de transições abruptas entre posições — funções contínuas suficientemente precisas para passagem de gradiente.

"Isto não é um sistema de trading pronto — é uma formulação diferente

do problema," enfatizam os autores.

Como resultado: o gradiente em relação à razão de Sharpe se propaga para trás através de todo o pipeline até os pesos da rede neural. O modelo treina diretamente no critério pelo qual será avaliado em produção.

Sharpe +1.73 e +1.15 Após Comissões

O protótipo foi testado em dois trimestres consecutivos held-out — períodos que o modelo não viu durante treinamento ou ajuste de hiperparâmetros. Sharpe +1.73 no primeiro trimestre e +1.15 no segundo após considerar comissões reais. Ambos os valores excedem um — o benchmark baseline aceito para estratégias algorítmicas. O código, dados e protocolo completo do experimento foram publicados em acesso aberto. Qualquer um com acesso a dados de mercado similares pode reproduzir os resultados. Os autores deliberadamente evitaram complexidade — nenhuma arquitetura exótica ou features não padrão: apenas uma mudança na função de perda.

O Que Isso Significa

DiffQuant demonstra que formulação correta do problema importa mais que escolha de arquitetura. Se uma estratégia em produção é avaliada por Sharpe — otimização durante treinamento deve almejar precisamente isso, não substitutos. Para fundos quants e pesquisadores independentes, este é um sinal prático: o gap entre objetivo de treinamento e métrica real pode ser fechado tecnicamente — e isso muda não apenas o resultado, mas também o que o modelo aprende.

ZK
Hamidun News
Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Quer parar de ler sobre IA e começar a usar?

AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.

O que você acha?
Carregando comentários…