Coefficient de corrélation [Exploitation graphique de résultats]

Coefficient de corrélation

On définit les grandeurs suivantes (valeurs moyennes de y et x respectivement) :

\(\bar{y}=\sum\limits_{i=1}^{n}{{{y}_{i}}}\)

\(\bar{x}=\sum\limits_{i=1}^{n}{{{x}_{i}}}\)

Le coefficient de corrélation linéaire s'écrit alors sous la forme suivante :

\({{R}^{2}}=\frac{{{\left[ \sum\limits_{i=1}^{n}{({{x}_{i}}-\bar{x})({{y}_{i}}-\bar{y})} \right]}^{2}}}{\sum\limits_{i=1}^{n}{{{({{x}_{i}}-\bar{x})}^{2}}}\ \sum\limits_{i=1}^{n}{{{({{y}_{i}}-\bar{y})}^{2}}}}\)

Si R² = 0 → indépendance de y vis à vis de x
Si 0< R² <1 → corrélation avec dépendance d'autant plus forte que R² est plus proche de 1
Si R² = 1 → dépendance fonctionnelle de y en x

Donc plus ce coefficient de corrélation sera proche de 1, meilleure sera l'estimation, c'est à dire la précision des mesures effectuées pour le tracé de la droite. En pratique, on considère généralement que l'ajustement linéaire est valide lorsque R² est supérieur à 0,75.

Attention :

Attention toutefois, le coefficient donne une valeur de dépendance entre x et y, mais pas nécessairement une relation de causalité ! Il faut donc se méfier d'un certain nombre de cas atypiques qui seront présentés en séance de cours.