12: Comparaisons de moyennes

12


Comparaisons de moyennes




I Introduction


Nous abordons d’abord dans ce chapitre la comparaison d’une moyenne à une moyenne de référence et la comparaison de deux moyennes pour deux échantillons indépendants. L’objet est de décomposer la procédure systématique de mise en œuvre des tests en six étapes. Il faut préciser tout d’abord le nombre de groupes à comparer et s’ils sont ou non indépendants. Il faut aussi identifier le type de variable examiné et sa distribution, ainsi que la taille de l’échantillon. Celle-ci oriente soit vers de grands échantillons pour lesquels une approximation de la distribution de la moyenne par une loi normale est envisageable, soit vers de petits échantillons (taille < 30) pour lesquels cette approximation n’est plus appropriée. Nous préciserons la loi suivie par l’écart réduit, les conditions d’application du test, la mise en place des règles de décision, la réalisation de l’expérience, le calcul de la réalisation de la statistique de test, la décision qui peut être envisagée, l’interprétation des résultats et la conclusion retenue. Nous illustrerons la procédure avec des exemples.


Nous évoquerons enfin le cas particulier des séries appariées, c’est-à-dire lorsque les échantillons comparés ne sont pas indépendants.



Cas d’échantillons indépendants



II Comparaisons de moyennes, cas gaussien


Pour les échantillons de grande taille que nous avons définis (taille ≥ 30) nous présenterons d’abord la comparaison d’une moyenne à une moyenne de référence, puis la comparaison de deux moyennes.



A Comparaison d’une moyenne à une moyenne de référence



1: Position du problème À partir des éléments observés dans un échantillon tiré d’une population A que peut-on dire d’une éventuelle différence entre l’espérance μA de la population A, et μ celle de la population de référence ?



On suppose que la moyenne XA variable aléatoire, moyenne de l’échantillon A, suit une loi normale d’espérance μA et d’écart-type image.On ne connaît pas μA mais on connaît μ et on suppose image. On souhaite tester si : δ = μA − μ = 0.


On fait l’hypothèse que sous H0 : δ = 0.


D = (image) est une variable centrée d’espérance :


image



et de variance image(D) = V(D) = Vimage.


Si σ est inconnu, et estimé par S, alors V(D) est estimé par image.


Pour construire une statistique de test, de distribution connue, on réduit la variable D. La statistique de test devient C = image. Lorsque σ est inconnu, la statistique de test devient :


image


La statistique de test C, pour ces grands échantillons, suit sous H0 :





3: Étapes de mise en œuvre du test statistique Nous reprendrons les six étapes que nous avons définies dans le chapitre précédent.






Étape 3 – Choix du seuil α et intervalle de pari: En pratique, l’intervalle de pari est construit à partir de la table de l’annexe A1 pour la valeur retenue du risque α.


La distribution de U : soit U une variable aléatoire de distribution normale centrée réduite d’espérance μ = 0 et d’écart-type σ = 1. La table de l’annexe A donne, connaissant p, la valeur de up (quantile d’ordre p) telle que :


image


La lecture de la table A se fait de la façon suivante. Si p < 0,5 alors up est inférieur à 0. La valeur est l’opposée de la valeur lue dans la table. Ici pour p = 0,025, on lit up = 1,960. Sa valeur est donc de − 1,960.


Si p> 0,5 alors up est > 0. La valeur de up est celle lue dans la table. Ici pour p = 0,975 on lit up = 1,960.


Construction de l’intervalle de pari au risque 1 − α . Dans notre exemple, pour α = 5 %, l’intervalle de pari est situé selon la lecture de la table entre les deux bornes [− 1,96 ; + 1,96] et peut être représenté par le schéma suivant (fig. 12.4).







Étape 5 – Recueil des données, vérification des conditions de validité du test, et calcul de la statistique de test: On réalise l’expérience. On recueille les données.


Les données pour l’échantillon sont respectivement, son effectif : nA = 30, sa moyenne : image = 3 600 g, et sa variance : image = 36·104 g2.


Pour la population de référence la moyenne théorique est notée μ = 3 400 g.


Vérifions les conditions d’application du test : ici l’effectif est égal à 30. Le cas des grands échantillons peut être retenu. Il n’y a pas d’hypothèse de normalité de la distribution de la variable dans la population. En effet, l’hypothèse porte sur la distribution de la moyenne.



Calcul de u, réalisation de la variable aléatoire U :


image


La valeur de u est comprise dans l’intervalle de pari 1 − α, donc H0 ne peut pas être rejetée au risque α.



Étape 6 – Conclusion: On conclut que le poids de naissance moyen des nouveau-nés de mères diabétiques n’est pas significativement différent de celui des nouveau-nés de mères non diabétiques multipares, au risque α de 5 %.


Dans cet exemple, que se passerait-il si les mêmes résultats avaient été obtenus à partir d’un échantillon de 50 sujets (au lieu de 30) ?


La nouvelle valeur de u devient dans ce cas :


image


La valeur de u est ici supérieure à 1,96 (au risque α de 5 %). On peut alors rejeter H0 et accepter H1. On conclura que le poids de naissance moyen des nouveau-nés de mères diabétiques est significativement différent de celui des nouveau-nés de mères non diabétiques multipares, au risque α de 5 %. La puissance du test est ainsi plus élevée avec 50 sujets qu’avec 30 sujets.


Remarque sur la puissance du test : ainsi, comme nous l’avions noté précédemment, la puissance augmente avec la taille de l’échantillon. Plus exactement, l’augmentation de la précision est proportionnelle à la racine carrée de l’effectif. Ainsi, pour une précision 10 fois meilleure, il faudrait inclure 100 fois plus d’individus.



B Comparaison de deux moyennes




2: Exemple Un chercheur soumet deux groupes de 50 rats à deux régimes alimentaires A et B différents. Il souhaite comparer les poids moyens des rats dans les deux groupes à l’issue du régime. Sa question est ainsi formulée : les poids moyens des rats sont-ils différents au décours des deux régimes alimentaires ? Le risque α retenu est ici de 5 %.


Le poids moyen des animaux à la fin de l’expérience est fourni tableau 12.I. Les échantillons sont indépendants.



Afin de comparer les poids moyens des rats à l’issue des deux régimes alimentaires A et B, on réalisera un test statistique comparant les moyennes des poids, obtenues dans les deux échantillons indépendants d’animaux.


Le nombre de groupes à comparer est de deux. Les séries sont indépendantes. La variable poids est quantitative. La distribution des poids moyens est gaussienne. Il s’agit de grands échantillons, d’effectifs supérieurs à 30. Notre objectif est de réaliser un test d’hypothèses.



3: Étapes de mise en œuvre du test statistique Nous allons dérouler pour cet exemple les six étapes de mise en œuvre d’un test présentées précédemment.





Étape 2 – Construction de la statistique de test:



Cela signifie que les deux échantillons ont la même espérance que celle de la population avec : μA = μB = μ


image


E(D) = Eimage


image


Les deux échantillons étant indépendants, la variance de la différence D est la somme des variances de image et de image.


Donc V(D) = Vimage


image est estimée par image et V (image) est estimée par image.


La statistique de test image est alors définie par la variable aléatoire U :


image


U suit sous H0 exactement une loi normale centrée réduite si les Xi sont gaussiens et si image et image sont connues. Elle suit approximativement une loi normale centrée réduite si nA et nB sont grands quelle que soit la loi des Xi, et de variances inconnues estimées par image et image.


Les conditions d’application du test sont : d’une part de disposer d’effectifs supérieurs ou égaux à 30 ; d’autre part, de disposer d’échantillons indépendants. C’est le cas dans cet exemple.




Étape 4 – Mise en place de la règle de décision: La règle est construite autour de H0. Le principe est de considérer a priori que H0 est vraie. La valeur de u calculée est :


image


On étudie le degré de compatibilité (principe de vraisemblance) de la valeur observée du paramètre sur l’échantillon avec sa valeur théorique :


Stay updated, free articles. Join our Telegram channel

May 9, 2017 | Posted by in GÉNÉRAL | Comments Off on 12: Comparaisons de moyennes

Full access? Get Clinical Tree

Get Clinical Tree app for offline access