Coefficient de corrélationUn coefficient de corrélation est une mesure numérique d'un certain type de corrélation linéaire, c'est-à-dire d'une relation statistique entre deux variables. Les variables peuvent être deux vecteurs d’un ensemble de données d’observations donné, souvent appelé échantillon, ou deux composantes d’une variable aléatoire multivariée avec une distribution connue. Il existe plusieurs types de coefficients de corrélation, chacun ayant sa propre définition, ses propres propriétés, et une utilisation spécifique. Le coefficient de correlation s'exprime toujours en une valeur comprise entre -1 et 1, avec 0 indiquant l'absence de correlation tandis que ±1 indiquent la plus forte corrélation possible[1]. En tant qu'outils d'analyse, les coefficients de corrélation présentent certains problèmes, notamment la propension de certains types à être déformés par des valeurs aberrantes et la possibilité d'être utilisés à tort pour déduire une relation causale entre les variables (pour plus d'informations, voir La corrélation n'implique pas la causalité )[2]. TypesIl existe différents types de mesures du degré de corrélation, en fonction notamment du type de données : selon que la donnée observée est une mesure, une donnée ordinale ou catégorielle. PearsonLe coefficient de corrélation produit-moment de Pearson, également connu sous le nom de r, R ou Pearson r, est une mesure de la force et de la direction de la relation linéaire entre deux variables qui est définie comme la covariance des variables divisée par le produit de leurs écarts types[3]. Il s’agit du type de coefficient de corrélation le plus connu et le plus couramment utilisé. Lorsque le terme « coefficient de corrélation » est utilisé sans autre précision, il fait généralement référence au coefficient de corrélation produit-moment de Pearson. Intra-classLa corrélation intraclasse (ICC) est une statistique descriptive qui peut être utilisée lorsque des mesures quantitatives sont effectuées sur des unités organisées en groupes ; elle décrit à quel point les unités d'un même groupe se ressemblent. RangLa corrélation de rang est une mesure de la relation entre les classements de deux variables, ou deux classements de la même variable :
Tétrachoriques et polychoriquesLe coefficient de corrélation polychorique mesure l’association entre deux variables catégorielles ordonnées. Il est techniquement défini comme l'estimation du coefficient de corrélation de Pearson que l'on obtiendrait si :
Lorsque les deux variables sont dichotomiques au lieu d’être de catégorie ordonnées, le coefficient de corrélation polychorique est appelé coefficient de corrélation tétrachorique. Interprétation des valeurs du coefficient de corrélationLa corrélation entre deux variables a des associations différentes qui sont mesurées par des valeurs telles que r ou R Les valeurs de corrélation vont de −1 à +1, où ±1 indique la corrélation la plus forte possible et 0 indique l'absence de corrélation entre les variables[1].
Voir aussi
Notes et références
Liens externes
|
Portal di Ensiklopedia Dunia