Principe

La régression linéaire est un outil (mathématique) statistique qui permet de définir une loi linéaire entre deux variables intervenant dans un même phénomène. Les calculettes et tableurs proposent des formules prêtes à être utilisées mais elles ne conviennent qu'à un type de cas. La méthode statistique est basée sur le fait que le cumul d'erreurs s'annule en moyenne. Le coefficient de corrélation est un indicateur sur la qualité des données.

Les formules seront démontrées ultérieurement dans d'autres UV, seule l'utilisation de la régression sera discutée ici.

Expérimentalement, on détermine des couples de valeurs (xi ; yi), et on cherche à déterminer deux paramètres a et b tels que la droite d'équation y = a + b x représente la meilleure estimation de ces couples de valeurs. Cette droite est appelée « courbe d'estimation de y en fonction de x ». Le paramètre a est l'ordonnée à l'origine de la droite et b est son coefficient angulaire ou coefficient de régression (voir figure[1]).

Résultat d'une régression linéaire réalisée sur une collection de points.