Test de Student

test statistique

En statistique, un test de Student[1], ou test t[2], désigne n'importe quel test statistique paramétrique où la statistique de test calculée suit une loi de Student lorsque l’hypothèse nulle est vraie.

Test de Student
Régions de rejet au niveau 10% d'un test de Student à 7 degrés de liberté.
Type
Test statistique, test paramétrique (d)Voir et modifier les données sur Wikidata
Inventeur
William Gosset (« Student »)

Histoire

modifier
 
Façade de la brasserie historique Guinness de St. James.
 
William Sealy Gosset, qui inventa le test t, sous le pseudonyme Student.

Le test de Student et la loi de probabilités qui lui correspond ont été publiés en 1908 dans la revue Biometrika par William Gosset[3]. Gosset, un employé de la brasserie Guinness à Dublin, y avait développé le test t à des fins de contrôle de la qualité de la production de bière stout. La brasserie avait pour règle que ses chimistes ne publient pas leurs découvertes. Gosset argua que son article ne serait d'aucune utilité pour les concurrents et obtint l'autorisation de publier mais sous un pseudonyme, Student, pour éviter les difficultés avec les autres membres de son équipe[4].

Le test t est devenu célèbre grâce aux travaux de Ronald Fisher qui montra que ce test ne couvre pas le cas des échantillons de grande taille. Il apporta donc des modifications au test de Student afin de le généraliser.

Exemples d'utilisation

modifier

Le test t a plusieurs utilisations dont voici les plus fréquentes :

  • Comparaison de moyenne d'une loi normale à une valeur si la variance est inconnue.
  • Comparaison de deux moyennes issues de deux lois normales si leurs variances sont égales et inconnues. Dans le cas où leurs variances sont différentes et inconnues, on utilise une adaptation appelée le test t de Welch.
  • Test sur les coefficients dans le cadre d'une régression linéaire.
  • Test sur des échantillons appariés[pas clair]

Test de Student sur un échantillon de loi normale

modifier

On considère une population de loi normale de moyenne μ et d'écart type σ. L'écart type σ n'est pas connu. On souhaite tester si la moyenne μ est égale à une valeur déterminée μ0. L'hypothèse nulle est H0 : μ = μ0, autrement dit on suppose a priori que la moyenne vaut μ0. On se place maintenant sous l'hypothèse nulle.

On considère un échantillon de taille n de cette population  , autrement dit, selon l'hypothèse nulle, chaque   est une variable aléatoire qui suit une loi normale de moyenne μ0 et d'écart type σ. De plus, les   sont indépendantes. On estime alors la moyenne par la moyenne empirique :

  .

Comme l’hypothèse nulle est supposée vraie, la moyenne   suit également une loi normale d'espérance μ0, mais d'écart type σ/n. Comme la variance σ2 est inconnue, on l'estime par son estimateur sans biais (on note la division par   au lieu de   afin d'avoir un estimateur sans biais) :

 .

Définition de la statistique

modifier

D'après le théorème de Cochran, sous l'hypothèse nulle,  suit une loi du chi deux à n – 1 degrés de liberté.

On pose la statistique de test suivante :

 

Par définition, la statistique   suit une loi de Student à n – 1 degrés de liberté. La réalisation de la statistique de test :

  .

Mise en place du test

modifier
 
Fonction de densité de la loi de Student à 7 degrés de liberté. La zone rouge est la région de rejet.

On rappelle que l'on veut tester H0 : μ = μ0. On choisit un risque α, généralement 0,05 ou 0,01[réf. nécessaire]. Le risque α s'appelle risque de première espèce, c'est la probabilité de rejeter   dans le cas où   est vraie. La figure ci-contre correspond à un risque   de 0,1 et  , et donc une loi de Student avec   degrés de liberté. La figure montre le quantile d'ordre   (à gauche) et celui d'ordre   (à droite). Comme la loi de Student est symétrique, ces quantiles sont égaux au signe près.

  • Si la valeur de   (sur l'axe des abscisses) est dans la zone bleue (entre les deux quantiles), alors on conserve l'hypothèse nulle.
  • Si elle est dans la zone rouge, on rejette l'hypothèse nulle.

Dit autrement, si |z| est supérieur au quantile d'ordre 1 – α/2 de la loi de Student à n – 1 degrés de liberté alors on rejette l'hypothèse nulle.

Variantes

modifier
 
Fonction de densité de la loi de Student à 7 degrés de liberté (toujours et encore) mais cette fois la région de rejet pour tester  .

Examinons la variante où cherche à tester l'hypothèse nulle H0 : μμ0. Dans ce cas, une valeur de z négative n'est pas discriminante et si z est dans la région bleue de la figure ci-contre alors on conserve l'hypothèse nulle. Par contre, si z est supérieur au quantile d'ordre 1 – α de la loi de Student à n – 1 degrés de liberté alors on rejette l'hypothèse nulle (région rouge à droite pour un risque de   = 10%).

 
Fonction de densité de la loi de Student à 7 degrés de libertés (encore et toujours) mais cette fois la région de rejet pour tester pour  .

Tester H0 : μμ0 se fait de manière symétrique. Cette fois ci, des valeurs positives de z ne sont pas discrimantes. Si z est inférieur au quantile d'ordre α de la loi de Student à n – 1 degrés de liberté (région rouge à gauche pour un risque de   = 10% dans la figure) alors on rejette l'hypothèse nulle.

Implémentation

modifier
Langage/Logiciel Fonction Notes
R t.test [1]
SAS PROC TTEST [2]
Python scipy.stats.ttest_ind [3]
Matlab ttest [4]
Mathematica TTEST [5]
Stata ttest [6]
Julia OneSampleTTest

EqualVarianceTTest

[7]
Maple OneSampleTTest, TwoSampleTTest, TwoSamplePairedTTest [5]

Notes et références

modifier
  1. Bernard Ycart, « Tests statistiques », Cahier de Mathématiques Appliquées, no 6,‎ (lire en ligne [PDF])
  2. Gaël Millot, Comprendre et réaliser les tests statistiques à l'aide de R : manuel de biostatistique, dl 2018 (ISBN 978-2-8073-0291-4 et 2-8073-0291-2, OCLC 1023590131, lire en ligne)
  3. (en) "Student" William Sealy Gosset, « The probable error of a mean », Biometrika, vol. 6, no 1,‎ , p. 1–25 (DOI 10.1093/biomet/6.1.1)
  4. Harold Hotelling (1930, p. 189) dans un article de British statistics cité par S. L. Zabell dans (en) S. L. Zabell, « On Student's 1908 paper "The probable error of the mean" », Journal of the American Statistical Association, vol. 103,‎ , p. 1-7 (DOI 10.1198/016214508000000030, JSTOR 27640017)
  5. « Student's t-Test - Maple Help », sur www.maplesoft.com (consulté le )

Voir aussi

modifier
  • Loi de Student, la loi de probabilité de la statistique dans le test t
  • Test t de Welch, une adaptation pour comparer deux moyennes de deux lois normales dont les variances sont inconnues et inégales
  • Test de Wald