13: Comparaisons de proportions

13


Comparaisons de proportions




I Introduction


Nous abordons dans ce chapitre l’étude de variables qualitatives à deux modalités (ou classes) qui conduit à des résultats s’exprimant sous forme de proportions (ou pourcentages) ; ainsi on s’intéressera à la comparaison d’une proportion à une proportion de référence et à la comparaison de deux proportions sur deux échantillons indépendants ou sur deux échantillons appariés. Nous vérifierons les conditions d’approximation de la distribution de ces proportions par une loi normale. Nous présentons également l’étude de variables qualitatives à plus de deux modalités en utilisant les tableaux de contingence et en faisant appel à la loi du khi-deux. Comme dans le chapitre précédent nous décomposerons la procédure systématique de mise en œuvre des tests en six étapes. Il faut préciser tout d’abord les groupes à comparer et s’ils sont ou non indépendants. Il faut identifier la nature qualitative des variables d’intérêt, à deux ou plusieurs classes. Nous préciserons la loi suivie par la statistique de test, les conditions d’application du test, la mise en place des règles de décision, la réalisation de l’expérience, le calcul de la réalisation de cette statistique de test, la décision qui peut être envisagée, l’interprétation des résultats et la conclusion retenue. Nous illustrerons la procédure avec des exemples.




Cas d’échantillons indépendants



II Comparaisons de proportions, cas gaussien


Dans les trois premiers paragraphes de cette partie (A, B et C), on étudiera une variable qualitative à deux modalités et on sera amené à comparer deux proportions d’individus qui présentent une de ces deux modalités. Dans le dernier paragraphe (D), cette étude sera étendue aux variables qualitatives présentant plus que deux modalités, et donc à la comparaison de plusieurs proportions.



A Comparaison d’une proportion à une proportion de référence



1: Position du problème



À partir d’une proportion pA observée dans un échantillon de taille nA tiré d’une population A, que peut-on dire d’une éventuelle différence entre πA la proportion théorique de la population A et π proportion de la population de référence ?


Nous allons tester si la différence δ = πA − π est nulle. Nous supposerons que cette différence est bien nulle, c’est ce qu’on appelle l’hypothèse nulle H0.


Nous supposerons que la proportion PA, variable aléatoire proportion d’individus présentant cette modalité, suit approximativement une loi normale. Sous H0, cette loi normale a une moyenne πA = π et un écart-type :


image


L’estimation de δ est D = PA − π.


Sous H0, l’espérance de D : E(D) = E(PA − π) = (π − π) = 0.


Pour construire une statistique de test de distribution connue, on réduit la variable D. Le critère de test devient : image.


On calcule image.


Sous H0, compte tenu de l’approximation gaussienne précédemment citée, la variable aléatoire C est une variable U normale, centrée, réduite.


Prenons un exemple pour illustrer ce test.



2: Exemple Dans une enquête nationale, le taux de complications sévères survenues après une certaine intervention chirurgicale est de 10 %. On mesure ce taux de complications sévères dans un hôpital : pour 120 interventions réalisées, il est de 15 %. Peut-on conclure que le taux de complications sévères survenues dans l’hôpital étudié est significativement différent de celui observé dans l’enquête nationale, au risque α de 5 % ?


Pour tester une telle hypothèse nous pouvons faire appel à un test qui reviendra ici à comparer la proportion observée de complications sévères dans l’hôpital étudié, à la proportion théorique obtenue à partir de l’enquête nationale. Nous allons pour ce faire mettre en œuvre les six étapes du développement d’un test : formulation des hypothèses à tester, construction d’une statistique de test, choix d’un seuil α et construction de l’intervalle de pari de niveau 1 − α, mise en place de la règle de décision, recueil des données, calcul de la statistique de test et vérification des conditions de validité du test, enfin interprétation des résultats et conclusion.



3: Étapes de mise en œuvre du test statistique Nous reprendrons les six étapes que nous avons définies précédemment.






Étape 3 – Choix du seuil α et intervalle de pari: On choisit le risque α généralement égal à 5 %. On construit ensuite un intervalle de pari (IP) pour U de niveau 1 − α tel que, si H0 est vraie :


image


En pratique, l’intervalle de pari est construit à partir de la table A pour la valeur retenue du risque α (fig. 13.2). Connaissant p, cette table donne la valeur de up, quantile d’ordre p, telle que :



image



Pour α = 5 %, pour les deux valeurs de p, respectivement : p = 0, 025 et p = 1 − 0, 025 = 0, 975 on lit les deux valeurs correspondantes de uα/2 et u1 − α/2. Ces valeurs de up sont respectivement de − 1,960 et de + 1,960.


Ainsi, pour α = 0,05, l’intervalle de pari se situe entre [− 1,96 ; + 1,96].







B Comparaison de deux proportions sur deux échantillons indépendants



1: Position du problème



Soient deux populations A et B desquelles ont été extraits deux échantillons de taille nA et nB respectivement. À partir des proportions pA et pB observées dans les deux échantillons, que peut-on dire d’une éventuelle différence entre les proportions théoriques πA et πB ?


Ici nous allons tester si la différence δ = πA − πB est nulle. Nous supposerons que cette différence est bien nulle sous l’hypothèse nulle appelée H0.


Supposons que les proportions PA et PB, variables aléatoires de proportions d’individus présentant cette modalité dans les populations A et B, suivent approximativement une loi normale. Sous H0, ces lois normales ont :



L’estimation de δ est D = PA−PB.


Sous H0, l’espérance de D : E(D) = E(PA − PB) = (π0 − π0) = 0.


Pour construire une statistique de test de distribution connue, on réduit la variable D. Le critère de test devient : image.


On calcule ensuite la variance de la différence entre les proportions V(D) :


image


En effet, les deux échantillons étant indépendants, la covariance est donc nulle. La variance de la différence se réduit alors à la somme des variances.


Sous H0, compte tenu de l’approximation gaussienne précédemment citée, la variable aléatoire C est une variable U normale, centrée, réduite.


Prenons un exemple pour illustrer ce test.




3: Étapes de mise en œuvre du test statistique Mettons en place un test statistique de comparaison des taux de complications sévères entre les deux types d’hôpitaux, de grande taille et de petite taille. Utilisons la procédure en six étapes que nous avons déjà présentée.




Étape 1 – Formulation des hypothèses à tester: Formulons les deux hypothèses en présence, hypothèse nulle et hypothèse alternative.


Stay updated, free articles. Join our Telegram channel

May 9, 2017 | Posted by in GÉNÉRAL | Comments Off on 13: Comparaisons de proportions

Full access? Get Clinical Tree

Get Clinical Tree app for offline access