L’asymétrie et la kurtosis sont deux mesures statistiques utilisées pour décrire la forme et la distribution des données dans un ensemble de données.
L’asymétrie fait référence à la mesure de l’asymétrie dans une distribution. Il indique si les données sont réparties symétriquement autour de sa moyenne. Une valeur d’asymétrie de 0 indique que les données sont parfaitement symétriques, ce qui signifie que les queues gauche et droite de la distribution sont également équilibrées autour de la moyenne. L’asymétrie positive (> 0) indique que la distribution a une queue droite plus longue, ce qui signifie qu’il y a des valeurs plus extrêmes sur le côté droit de la distribution. Inversement, l’asymétrie négative (<0) indique une queue gauche plus longue, avec des valeurs plus extrêmes sur le côté gauche de la distribution. La signification de l'asymétrie réside dans sa capacité à quantifier le départ d'une distribution de symétrie. Il donne un aperçu de la forme et de la nature de la distribution des données, mettant en évidence si les données sont concentrées vers une extrémité de la distribution ou s'étalaient plus uniformément à travers la plage de valeurs. Une bonne valeur d'asymétrie dépend du contexte et des exigences spécifiques de l'analyse. Généralement, une valeur d'asymétrie proche de 0 (entre -0,5 et +0,5) indique une distribution presque symétrique. Ceci est souvent considéré comme souhaitable pour de nombreuses analyses statistiques car elle suggère une distribution équilibrée autour de la moyenne. Cependant, l'interprétation de l'asymétrie dépend également de l'application et de la nature des données. Dans certains cas, une asymétrie légèrement positive ou négative peut être acceptable ou même attendue, selon le domaine et les caractéristiques sous-jacentes des données étudiées. Le kurtosis, en revanche, mesure la "queue" d'une distribution, indiquant quelle part de la distribution est concentrée dans la queue plutôt que au centre. Une valeur de kurtosis de 3 (excès de kurtosis de 0) est souvent utilisée comme référence pour une distribution normale. Des valeurs supérieures à 3 indiquent des queues plus lourdes (distribution leptokurtique), tandis que des valeurs inférieures à 3 indiquent des queues plus légères (distribution platykurtique). Une "bonne" valeur de kurtosis dépend des exigences spécifiques de l'analyse. Dans certains cas, une kurtosis près de 3 peut être préférée, en particulier lors de l'analyse des données financières ou des rendements boursiers où des queues lourdes peuvent indiquer un risque plus élevé.