Vous n'êtes pas identifié(e).

#1 20-11-2023 23:22:47

Climax
Administrateur
Inscription: 30-08-2008
Messages: 6 435
Windows 10Firefox 119.0

Modèles non paramétriques en finance et trading


modelisation-financiere.jpg

Les modèles non paramétriques en finance sont précieux pour leur flexibilité et leur adaptabilité à différents types de données financières.

Ils sont particulièrement utiles dans les scénarios où les données sous-jacentes ne se conforment pas aux hypothèses de distribution standard (par exemple, la distribution normale).

Nous aborderons de nombreux exemples de modèles mathématiques non paramétriques en finance.

Principaux enseignements

➡️ Les modèles non paramétriques en finance offrent flexibilité et adaptabilité.

➡️ Ils ne supposent pas de forme fonctionnelle ou de distribution préexistante (c'est-à-dire qu'ils ne supposent pas de forme particulière pour la relation entre les variables d'entrée et la sortie).

➡️ Ils traitent efficacement les données qui défient les hypothèses de distribution standard.

➡️ Ces modèles, dont LOESS/LOWESS, la VaR historique et l'estimation de la densité du noyau (parmi beaucoup d'autres), excellent dans la capture des tendances non linéaires, des risques de queue et des relations complexes dans les ensembles de données financières.

➡️ Pour être efficaces, les méthodes non paramétriques nécessitent des données et des ressources informatiques importantes.

Modèles de régression locale (LOESS/LOWESS)

Ces modèles lissent les données de séries temporelles en adaptant des modèles simples (linéaires ou quadratiques, par exemple) à des sous-ensembles localisés de données.

Cette approche est efficace pour capturer les tendances et les modèles non linéaires dans les séries temporelles financières sans supposer une forme fonctionnelle globale.

Mesures de risque non paramétriques

Les techniques telles que la valeur à risque (VaR) et le déficit attendu (Expected Shortfall, ES) utilisent des données historiques réelles pour estimer le risque des instruments financiers.

Ces modèles ne reposent sur aucune hypothèse de distribution et sont directement basés sur la distribution empirique des rendements.

Ils permettent donc de mieux appréhender les risques de queue sur les marchés financiers.

Les risques de queue posent généralement un problème avec les hypothèses standard de la distribution normale.

Parce qu'elle est à queue fine par rapport à la plupart des rendements financiers, les distributions normales sous-estiment généralement le risque de queue, et de meilleurs modèles sont nécessaires - soit des modèles paramétriques à queue plus large (par exemple, la distribution alpha-stable de Levy), soit des modèles non paramétriques qui peuvent être calibrés en fonction des données réelles.

Techniques d'estimation de la densité

Cette approche consiste à estimer la fonction de densité de probabilité d'une variable financière, comme les rendements des actifs, directement à partir des données.

Des méthodes telles que l'estimation de la densité par noyau sont utilisées pour créer une estimation lisse de la fonction de densité, reflétant plus précisément la distribution sous-jacente des données.

Ces méthodes sont plus fiables lorsque:

  • les données ne correspondent pas à un modèle paramétrique standard

  • vous savez que les données passées/courantes ressembleront aux données futures.

Arbres de décision et forêts aléatoires

Ces techniques d'apprentissage automatique sont utilisées pour les tâches de classification et de régression en finance.

Les forêts aléatoires, qui combinent plusieurs arbres de décision, sont utiles pour saisir les relations complexes dans les ensembles de données financières.

Tests non paramétriques

Des tests tels que le test de Kolmogorov-Smirnov, le test U de Mann-Whitney et le test de Kruskal-Wallis sont utilisés pour comparer des échantillons ou tester des hypothèses sans supposer une distribution spécifique.

Ils sont utiles dans la recherche financière pour

  • tester les anomalies

  • l'efficacité du marché, ou

  • comparer les distributions de rendement entre différents instruments

Optimisation non paramétrique de portefeuille

Les méthodes traditionnelles d'optimisation de portefeuille reposent souvent sur des hypothèses concernant la distribution des rendements.

(Par exemple, l'utilisation de l'écart-type suppose une distribution normale des rendements).

Les techniques non paramétriques, en revanche, utilisent la distribution réelle des rendements - soit par le biais de données historiques, soit par des techniques de rééchantillonnage - pour optimiser les portefeuilles.

Cela permet une évaluation plus réaliste des risques et des rendements.

Quels sont ces modèles non paramétriques d'optimisation de portefeuille ?

Nous allons les classer par catégories :

Simulation historique

Utilise des données de rendement historiques réelles pour modéliser le risque et le rendement d'un portefeuille.

Les méthodes paramétriques font des hypothèses sur la distribution des rendements.

Techniques de rééchantillonnage

Impliquent un échantillonnage répété des données de rendement historiques pour construire une gamme de résultats de portefeuille possibles pour l'optimisation.

Méthodes bootstrap

Génère de nombreux rééchantillons de données de rendement historiques afin d'estimer la distribution des rendements et des risques des portefeuilles.

Simulation Monte Carlo

Simule un large éventail de scénarios de rendement possibles pour les actifs du portefeuille.

Optimise ensuite l'allocation en fonction du risque et du rendement (et de tout autre objectif).

Optimisation Moyenne-CVaR

Se concentre sur l'optimisation de la valeur conditionnelle du risque (CVaR) - une mesure qui prend en compte les pertes extrêmes dans la queue de la distribution.

Optimisation robuste

Vise à créer des portefeuilles performants dans diverses conditions de marché, y compris dans les pires scénarios (là encore, sans s'appuyer sur des hypothèses spécifiques de distribution des rendements).

Méthodes empiriques de Bayes

Combine des données historiques avec des statistiques bayésiennes pour estimer les distributions de rendement, ce qui permet une mise à jour dynamique des croyances sur la base de nouvelles données.

Les "K-Nearest Neighbors" (KNN) dans la construction de portefeuilles

Dans la section suivante, l'algorithme KNN identifie les actifs présentant des caractéristiques de rendement similaires pour des applications telles que les séries chronologiques, la diversification et la gestion des risques.

Régression quantile pour l'allocation d'actifs

Utilise la régression quantile pour comprendre les relations entre les actifs dans différentes conditions de marché.

Aide à adapter les portefeuilles qui résistent aux mouvements extrêmes du marché.

Arbres de décision pour la sélection des actifs

Utilise des algorithmes d'arbres de décision pour sélectionner des actifs sur la base de divers indicateurs financiers.

Par exemple, les arbres de décision peuvent classer les actions en profils de risque sur la base d'indicateurs tels que le ratio P/E, la capitalisation boursière et les performances sectorielles.

K-Nearest Neighbors (KNN)

Cet algorithme est utilisé pour la classification et la régression en finance.

Il prédit la sortie d'un nouveau point de données sur la base des sorties des "K" points les plus proches dans l'ensemble d'apprentissage.

Cette méthode est utile pour prédire des séries chronologiques financières ou pour des choses comme l'évaluation du crédit dans le secteur bancaire.

Analyse par transformée en ondelettes

Cette technique décompose les données des séries chronologiques financières en différentes composantes de fréquence.

Elle permet une compréhension plus nuancée des caractéristiques des données dans le temps.

Elle permet de détecter les modèles cachés, les tendances et les changements brusques sur les marchés financiers.

L'analyse par transformée en ondelettes est appliquée à l'analyse et à la prévision des marchés financiers volatils, tels que les cours des actions ou les taux de change, où les caractéristiques des données peuvent changer rapidement au fil du temps.

Réseaux neuronaux artificiels (RNA)

Les réseaux neuronaux artificiels (RNA) sont un ensemble d'algorithmes librement inspirés du cerveau humain.

Ils sont conçus pour reconnaître des modèles.

Ils interprètent les données sensorielles par le biais de la perception automatique, de l'étiquetage et du regroupement des données brutes.

En finance, les RNA sont utilisés pour la modélisation prédictive dans l'analyse des marchés boursiers, l'évaluation du crédit et le commerce algorithmique.

Ils aident à identifier les relations non linéaires complexes entre les variables.

Machines à vecteurs de support (MVS)

Les MVS sont des modèles d'apprentissage supervisé qui analysent les données à des fins de classification et de régression.

Ils sont efficaces dans les espaces à haute dimension (c'est-à-dire lorsque de nombreux facteurs affectent les résultats) et dans les cas où le nombre de dimensions dépasse le nombre d'échantillons.

Les MVS sont utilisés dans la modélisation financière pour prédire les tendances des actifs et l'analyse du risque de crédit.

Splines et modèles additifs généralisés (MAG)

Les splines sont une série de segments polynomiaux reliés les uns aux autres, ce qui garantit la régularité à chaque point de rencontre des segments.

Les MAG étendent les modèles linéaires en autorisant des fonctions non linéaires des variables prédictives tout en maintenant l'interprétabilité.

En termes simples, ils sont essentiellement utilisés lorsque l'on souhaite ajuster des données à une courbe lisse, mais que l'on n'est pas sûr de la structure sous-jacente des points de données.

Ils permettent de faire des prédictions ou d'analyser des tendances.

Ces modèles sont utilisés dans l'analyse des courbes de rendement, pour l'ajustement de modèles non linéaires dans les prix des actifs et dans la modélisation des changements de taux d'intérêt.

Régression quantile

Cette technique permet d'estimer la médiane ou d'autres quantiles de la distribution conditionnelle de la variable réponse en fonction des variables prédictives.

Elle permet une analyse plus complète de la relation entre les variables.

Elle est particulièrement utile dans la gestion des risques financiers, où la compréhension des extrémités de la distribution (pertes ou gains extrêmes) peut être considérée comme plus importante que la moyenne ou la médiane de la distribution.

Splines de Régression Adaptatives Multivariées (SRAM)

SRAM est une technique de régression non paramétrique qui modélise automatiquement les non-linéarités et les interactions entre les variables.

Elle le fait en ajustant des régressions linéaires par morceaux, ce qui la rend très flexible.

SRAM est utilisé pour des tâches de modélisation financière complexes telles que la prédiction des rendements boursiers, des notations d'obligations et des indicateurs économiques où les relations entre les variables ne sont pas linéaires ou bien définies.

Modèles de volatilité non paramétriques

Ces modèles, tels que la volatilité réalisée utilisant des données à haute fréquence, ne supposent pas une forme fonctionnelle spécifique pour la volatilité des rendements des actifs.

Ils permettent de saisir plus efficacement les effets de grappe de la volatilité et de l'effet de levier.

Ces modèles peuvent être utilisés pour l'évaluation des produits dérivés, la gestion des risques et la construction d'indices de volatilité sur les marchés financiers.

Distorsion Temporelle Dynamique (DTD)

DTD est un algorithme permettant de mesurer la similarité entre différentes séquences temporelles dont la vitesse peut varier.

Il s'agit d'une méthode flexible qui permet d'étirer et de comprimer les séries temporelles afin de trouver une correspondance.

En finance, le DTD peut être utilisé pour analyser et comparer des séries temporelles financières, comme les mouvements de prix des actions, pour la reconnaissance de modèles et la détection d'anomalies.

Par exemple, comment le mouvement d'une action varie-t-il avec l'indice global (par exemple, GOOG et le S&P 500) ?

Comment deux actions similaires (par exemple, Ford et GM) évoluent-elles conjointement ?

Quelles leçons peut-on en tirer et peut-on les négocier ?

Régression isotonique

Il s'agit d'une technique de régression qui ajuste une fonction non décroissante aux données.

Elle est utile lorsque l'on sait que la réponse doit être une fonction non décroissante de certaines variables prédictives.

En termes plus simples, il s'agit de créer un modèle qui suit une règle : lorsqu'une variable augmente, l'autre variable ne diminue pas.

Cette approche est particulièrement utile lorsque vous avez déjà compris ou supposé que, dans une certaine situation, lorsqu'un élément croît ou progresse, l'autre élément doit rester le même ou croître également, mais ne doit jamais diminuer.

Pour utiliser un exemple non financier, imaginez que vous étudiez la relation entre le temps consacré à l'étude et les notes obtenues aux examens.

Intuitivement, si le temps d'étude augmente, on s'attend à ce que les résultats aux examens augmentent ou, au moins, ne diminuent pas. La régression isotonique est une méthode appropriée pour modéliser ce type de relation.

Elle est particulièrement utile en modélisation financière lorsqu'un ordre naturel est attendu, parfois dans les courbes de rendement (mais pas toujours) ou dans les profils de rendement cumulatif des portefeuilles d'investissement (par exemple, plus de temps passé sur le marché = rendements plus élevés).

Méthodes d'ensemble

Les méthodes d'ensemble combinent plusieurs techniques pour améliorer les résultats obtenus avec une seule d'entre elles.

Les techniques telles que Bagging et Boosting combinent les décisions de plusieurs modèles pour améliorer les performances globales.

Elles sont également non paramétriques, car elles ne supposent pas de forme spécifique pour le modèle, mais le construisent à partir des données ou de la mécanique de cause à effet sous-jacente.

Ces méthodes sont utilisées dans la modélisation du risque, l'évaluation du crédit et le trading algorithmique (où la robustesse et la précision sont les plus importantes).

Conclusion

Les modèles et techniques non paramétriques offrent une approche plus nuancée et plus souple de l'analyse des données financières, en particulier dans les situations où les données sous-jacentes sont complexes ou ne cadrent pas bien avec les modèles paramétriques traditionnels.

Ils sont utilisés dans la gestion des risques, l'optimisation des portefeuilles, l'analyse des marchés et la modélisation prédictive.

Néanmoins, ils peuvent être gourmands en données et en calculs, ce qui est un facteur important à prendre en compte lors de leur application.

Il faut également se méfier des modèles construits à partir de données historiques dans l'intention de les utiliser à terme.

Sur les marchés, le passé n'est pas nécessairement un indicateur fiable de l'avenir.

Il est préférable de se concentrer sur les relations de cause à effet sous-jacentes.

compte-demo.png


Le trading de CFD implique un risque de perte significatif, il ne convient donc pas à tous les investisseurs. 74 à 89% des comptes d'investisseurs particuliers perdent de l'argent en négociant des CFD.

Hors ligne

Utilisateurs enregistrés en ligne dans ce sujet: 0, invités: 1
[Bot] CCBot

Pied de page des forums