12
Comparaisons de moyennes
I Introduction
Nous abordons d’abord dans ce chapitre la comparaison d’une moyenne à une moyenne de référence et la comparaison de deux moyennes pour deux échantillons indépendants. L’objet est de décomposer la procédure systématique de mise en œuvre des tests en six étapes. Il faut préciser tout d’abord le nombre de groupes à comparer et s’ils sont ou non indépendants. Il faut aussi identifier le type de variable examiné et sa distribution, ainsi que la taille de l’échantillon. Celle-ci oriente soit vers de grands échantillons pour lesquels une approximation de la distribution de la moyenne par une loi normale est envisageable, soit vers de petits échantillons (taille < 30) pour lesquels cette approximation n’est plus appropriée. Nous préciserons la loi suivie par l’écart réduit, les conditions d’application du test, la mise en place des règles de décision, la réalisation de l’expérience, le calcul de la réalisation de la statistique de test, la décision qui peut être envisagée, l’interprétation des résultats et la conclusion retenue. Nous illustrerons la procédure avec des exemples.
Cas d’échantillons indépendants
II Comparaisons de moyennes, cas gaussien
A Comparaison d’une moyenne à une moyenne de référence
1: Position du problème À partir des éléments observés dans un échantillon tiré d’une population A que peut-on dire d’une éventuelle différence entre l’espérance μA de la population A, et μ celle de la population de référence ?
On fait l’hypothèse que sous H0 : δ = 0.
D = () est une variable centrée d’espérance :
et de variance (D) = V(D) = V
.
Si σ est inconnu, et estimé par S, alors V(D) est estimé par .
La statistique de test C, pour ces grands échantillons, suit sous H0 :
2: Exemple L’espérance du poids de naissance de nouveau-nés de mères multipares (ayant accouché plus d’une fois) non diabétiques est de 3 400 g. On étudie un groupe de 30 nouveau-nés de mères diabétiques : le poids de naissances des nouveau-nés est en moyenne de 3 600 g (écart-type : 600 g). Peut-on conclure que le poids de naissance des nouveau-nés de mères diabétiques est significativement différent de celui des nouveau-nés de mères multipares, au risque α de 5 % ?
3: Étapes de mise en œuvre du test statistique Nous reprendrons les six étapes que nous avons définies dans le chapitre précédent.
Étape 1 – Définition des hypothèses à tester: Définissons l’hypothèse nulle H0 et l’hypothèse alternative H1 :
• H0 : le poids de naissance des enfants de mères diabétiques n’est pas différent de celui de mères multipares non diabétiques ;
• H1 est l’hypothèse que l’on veut démontrer : le poids de naissance des enfants de mères diabétiques est différent de celui de mères multipares non diabétiques.
Plus formellement on peut écrire :
Étape 2 – Construction d’une statistique de test: On suppose H0 vraie. On cherche à définir une variable aléatoire C dont on connaisse la distribution, si H0 est vraie, et on construit un intervalle de pari de sa réalisation c. La statistique de test est dans ce cas de grand échantillon définie par la variable aléatoire U avec :
Étape 3 – Choix du seuil α et intervalle de pari: En pratique, l’intervalle de pari est construit à partir de la table de l’annexe A1 pour la valeur retenue du risque α.
Construction de l’intervalle de pari au risque 1 − α . Dans notre exemple, pour α = 5 %, l’intervalle de pari est situé selon la lecture de la table entre les deux bornes [− 1,96 ; + 1,96] et peut être représenté par le schéma suivant (fig. 12.4).
Étape 4 – Mise en place de la règle de décision: La règle est construite autour de H0. Le principe est de considérer a priori que H0 est vraie. La valeur de u calculée est :
• si u appartient à l’IP1−α on ne rejette pas H0 ;
• si u est en dehors de l’IP1−α alors on rejette H0 et on accepte H1.
Étape 5 – Recueil des données, vérification des conditions de validité du test, et calcul de la statistique de test: On réalise l’expérience. On recueille les données.
Pour la population de référence la moyenne théorique est notée μ = 3 400 g.
Fig. 12.6 La valeur de u est comprise dans la zone de non-rejet : H0 ne peut pas être rejetée au risque α.
Calcul de u, réalisation de la variable aléatoire U :
La valeur de u est comprise dans l’intervalle de pari 1 − α, donc H0 ne peut pas être rejetée au risque α.
B Comparaison de deux moyennes
1: Position du problème Il s’agit dans ce cas de comparer des moyennes à partir de deux échantillons. À partir des éléments observés dans deux échantillons A et B que peut-on dire d’une éventuelle différence entre l’espérance μA de la population A et μB celle de la population B ?
2: Exemple Un chercheur soumet deux groupes de 50 rats à deux régimes alimentaires A et B différents. Il souhaite comparer les poids moyens des rats dans les deux groupes à l’issue du régime. Sa question est ainsi formulée : les poids moyens des rats sont-ils différents au décours des deux régimes alimentaires ? Le risque α retenu est ici de 5 %.
Le poids moyen des animaux à la fin de l’expérience est fourni tableau 12.I. Les échantillons sont indépendants.
Tableau 12.I
Exemple : comparaison de deux moyennes, grands échantillons.
A | B | |
Effectif | 50 | 50 |
Poids moyen (g) | 200 | 240 |
Variance estimée du poids (g2) | 2 000 | 3 000 |
3: Étapes de mise en œuvre du test statistique Nous allons dérouler pour cet exemple les six étapes de mise en œuvre d’un test présentées précédemment.
Étape 1 – Définition des hypothèses à tester: Définissons l’hypothèse nulle H0 et l’hypothèse alternative H1 :
• H0 : dans cette expérience, le poids moyen à l’issue du régime A n’est pas différent de celui constaté après le régime B ;
• H1 : dans cette expérience, le poids moyen à l’issue du régime A est différent de celui constaté à l’issue du régime B.
Plus formellement on peut écrire :
On suppose H0 vraie. On cherche à définir une variable aléatoire U dont on connaisse la distribution, si H0 est vraie, et l’on construit un intervalle de pari de sa réalisation u.
Étape 2 – Construction de la statistique de test:
est estimée par
et V (
) est estimée par
.
La statistique de test est alors définie par la variable aléatoire U :
Étape 3 – Choix du seuil α et intervalle de pari: En pratique, l’intervalle de pari est construit à partir de la table de l’annexe A pour la valeur retenue du risque α. La distribution de U et la construction de l’intervalle de pari ont déjà été présentées dans le paragraphe II.A.3. Étapes de mise en œuvre du test statistique (page 302).
Étape 4 – Mise en place de la règle de décision: La règle est construite autour de H0. Le principe est de considérer a priori que H0 est vraie. La valeur de u calculée est :

Stay updated, free articles. Join our Telegram channel

Full access? Get Clinical Tree


