Coefficient de corrélation

On définit les grandeurs suivantes (valeurs moyennes de y et x respectivement) :

\(\bar{y}=\sum\limits_{i=1}^{n}{{{y}_{i}}}\)

\(\bar{x}=\sum\limits_{i=1}^{n}{{{x}_{i}}}\)

Le coefficient de corrélation linéaire s'écrit alors sous la forme suivante :

\({{R}^{2}}=\frac{{{\left[ \sum\limits_{i=1}^{n}{({{x}_{i}}-\bar{x})({{y}_{i}}-\bar{y})} \right]}^{2}}}{\sum\limits_{i=1}^{n}{{{({{x}_{i}}-\bar{x})}^{2}}}\ \sum\limits_{i=1}^{n}{{{({{y}_{i}}-\bar{y})}^{2}}}}\)

  • Si R2 = 0 → indépendance de y vis à vis de x

  • Si 0< R2 <1 → corrélation avec dépendance d'autant plus forte que R2 est plus proche de 1

  • Si R2 = 1 → dépendance fonctionnelle de y en x

Donc plus ce coefficient de corrélation sera proche de 1, meilleure sera l'estimation, c'est à dire la précision des mesures effectuées pour le tracé de la droite. En pratique, on considère généralement que l'ajustement linéaire est valide lorsque R2 est supérieur à 0,75.

Attention

Attention toutefois, le coefficient donne une valeur de dépendance entre x et y, mais pas nécessairement une relation de causalité ! Il faut donc se méfier d'un certain nombre de cas atypiques qui seront présentés en séance de cours.