Habr AI→ original

DiffQuant optimise directement le ratio de Sharpe via un simulateur de trading différentiable

La plupart des modèles de ML pour le trading apprennent à réduire la MSE, mais sont évalués au ratio de Sharpe — ce sont deux tâches différentes. DiffQuant…

Traité par IA depuis Habr AI ; édité par Hamidun News
DiffQuant optimise directement le ratio de Sharpe via un simulateur de trading différentiable
Source : Habr AI. Collage: Hamidun News.
◐ Écouter l'article

DiffQuant — un prototype open-source qui élimine une contradiction fondamentale dans le trading de ML : les modèles apprennent à minimiser l'erreur quadratique moyenne, mais sont évalués par le ratio de Sharpe. Les auteurs ont comblé cet écart en rendant tout le pipeline de trading — des features au PnL et aux commissions — un seul graphe computationnel différentiable.

Problème des Objectifs de Substitution

Dans la plupart des systèmes de ML pour le trading quantitatif, le schéma ressemble à ceci : entraîner un réseau neuronal pour prédire les rendements ou la direction du prix, en minimisant MSE ou BCE. Ensuite, sur ces prédictions, construire une stratégie de trading et l'évaluer par le ratio de Sharpe — le rapport entre le rendement moyen et la volatilité. Le problème : ces deux objectifs sont mathématiquement sans lien.

Un meilleur MSE ne garantit pas un meilleur Sharpe. En pratique, le réseau neuronal dépense des ressources pour réduire l'erreur de prédiction dans les régimes de marché où cela n'a aucun impact sur le résultat final du trading. Une amélioration de 15% de la précision des prévisions peut ne produire aucun gain de Sharpe — et c'est un problème documenté aussi bien dans les articles académiques que parmi les praticiens de l'industrie quantitative.

Les solutions partielles — les fonctions de perte de classement, les métriques proxy personnalisées, la pondération post-hoc — ne résolvent pas le cœur du problème : le gradient lors de l'entraînement ne voit pas la mécanique réelle du trading.

Comment Fonctionne le Simulateur Différentiable

DiffQuant résout directement le problème : tout le pipeline de trading est implémenté comme un seul graphe computationnel avec des opérations continues :

  • Features de marché → bloc de réseau neuronal de prédiction de signal
  • Signal → position cible en tenant compte des contraintes de taille et de direction
  • Position → PnL étape par étape avec modélisation explicite du glissement et des commissions
  • PnL accumulé → ratio de Sharpe comme fonction de perte scalaire différentiable

Le défi technique clé est de rendre le positionnement et les coûts différentiables, car les opérations de trading réelles sont discrètes. Les auteurs utilisent des approximations souples : au lieu de transitions abruptes entre les positions — des fonctions continues suffisamment précises pour la propagation du gradient.

«

Ceci n'est pas un système de trading prêt à l'emploi — c'est une formulation différente du problème », soulignent les auteurs.

En résultat : le gradient par rapport au ratio de Sharpe se propage à rebours à travers tout le pipeline jusqu'aux poids du réseau neuronal. Le modèle s'entraîne directement sur le critère selon lequel il sera évalué en production.

Sharpe +1.73 et +1.15 Après Commissions

Le prototype a été testé sur deux trimestres consécutifs tenus secrets — des périodes que le modèle n'avait pas vues lors de l'entraînement ni de l'ajustement des hyperparamètres. Sharpe +1.73 au premier trimestre et +1.15 au deuxième après prise en compte des commissions réelles. Les deux valeurs dépassent un — le benchmark baseline accepté pour les stratégies algorithmiques. Le code, les données et le protocole complet de l'expérience ont été publiés en accès ouvert. Quiconque ayant accès à des données de marché similaires peut reproduire les résultats. Les auteurs ont délibérément évité la complexité — aucune architecture exotique ni features non standard : seulement un changement de fonction de perte.

Ce Que Cela Signifie

DiffQuant démontre que la formulation correcte du problème importe plus que le choix de l'architecture. Si une stratégie en production est évaluée par Sharpe — l'optimisation lors de l'entraînement doit cibler précisément cela, pas des substituts. Pour les fonds quantitatifs et les chercheurs indépendants, ceci est un signal pratique : l'écart entre l'objectif d'entraînement et la métrique réelle peut être comblé techniquement — et cela change non seulement le résultat, mais aussi ce que le modèle apprend réellement.

ZK
Hamidun News
Actualités IA sans bruit. Sélection éditoriale quotidienne de plus de 400 sources. Produit de Zhemal Khamidun, Head of AI chez Alpina Digital.

Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?

AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.

Qu'en pensez-vous ?
Chargement des commentaires…