Coefficient de corrélation
On définit les grandeurs suivantes (valeurs moyennes de y et x respectivement) :
\(\bar{y}=\sum\limits_{i=1}^{n}{{{y}_{i}}}\)
\(\bar{x}=\sum\limits_{i=1}^{n}{{{x}_{i}}}\)
Le coefficient de corrélation linéaire s'écrit alors sous la forme suivante :
\({{R}^{2}}=\frac{{{\left[ \sum\limits_{i=1}^{n}{({{x}_{i}}-\bar{x})({{y}_{i}}-\bar{y})} \right]}^{2}}}{\sum\limits_{i=1}^{n}{{{({{x}_{i}}-\bar{x})}^{2}}}\ \sum\limits_{i=1}^{n}{{{({{y}_{i}}-\bar{y})}^{2}}}}\)
Si R2 = 0 → indépendance de y vis à vis de x
Si 0< R2 <1 → corrélation avec dépendance d'autant plus forte que R2 est plus proche de 1
Si R2 = 1 → dépendance fonctionnelle de y en x
Donc plus ce coefficient de corrélation sera proche de 1, meilleure sera l'estimation, c'est à dire la précision des mesures effectuées pour le tracé de la droite. En pratique, on considère généralement que l'ajustement linéaire est valide lorsque R2 est supérieur à 0,75.
Attention :
Attention toutefois, le coefficient donne une valeur de dépendance entre x et y, mais pas nécessairement une relation de causalité ! Il faut donc se méfier d'un certain nombre de cas atypiques qui seront présentés en séance de cours.