13
Comparaisons de proportions
I Introduction
Nous abordons dans ce chapitre l’étude de variables qualitatives à deux modalités (ou classes) qui conduit à des résultats s’exprimant sous forme de proportions (ou pourcentages) ; ainsi on s’intéressera à la comparaison d’une proportion à une proportion de référence et à la comparaison de deux proportions sur deux échantillons indépendants ou sur deux échantillons appariés. Nous vérifierons les conditions d’approximation de la distribution de ces proportions par une loi normale. Nous présentons également l’étude de variables qualitatives à plus de deux modalités en utilisant les tableaux de contingence et en faisant appel à la loi du khi-deux. Comme dans le chapitre précédent nous décomposerons la procédure systématique de mise en œuvre des tests en six étapes. Il faut préciser tout d’abord les groupes à comparer et s’ils sont ou non indépendants. Il faut identifier la nature qualitative des variables d’intérêt, à deux ou plusieurs classes. Nous préciserons la loi suivie par la statistique de test, les conditions d’application du test, la mise en place des règles de décision, la réalisation de l’expérience, le calcul de la réalisation de cette statistique de test, la décision qui peut être envisagée, l’interprétation des résultats et la conclusion retenue. Nous illustrerons la procédure avec des exemples.
Cas d’échantillons indépendants
II Comparaisons de proportions, cas gaussien
A Comparaison d’une proportion à une proportion de référence
Nous allons tester si la différence δ = πA − π est nulle. Nous supposerons que cette différence est bien nulle, c’est ce qu’on appelle l’hypothèse nulle H0.
L’estimation de δ est D = PA − π.
Sous H0, l’espérance de D : E(D) = E(PA − π) = (π − π) = 0.
2: Exemple Dans une enquête nationale, le taux de complications sévères survenues après une certaine intervention chirurgicale est de 10 %. On mesure ce taux de complications sévères dans un hôpital : pour 120 interventions réalisées, il est de 15 %. Peut-on conclure que le taux de complications sévères survenues dans l’hôpital étudié est significativement différent de celui observé dans l’enquête nationale, au risque α de 5 % ?
3: Étapes de mise en œuvre du test statistique Nous reprendrons les six étapes que nous avons définies précédemment.
Étape 1 – Définition des hypothèses à tester: Les hypothèses en présence sont les suivantes :
• pour l’hypothèse nulle H0 : le taux de complications dans l’hôpital étudié est égal à celui noté lors de l’enquête nationale ;
• pour l’hypothèse alternative H1 : le taux de complications dans l’hôpital étudié est différent de celui noté lors de l’enquête nationale.
Plus formellement on peut écrire : hypothèse nulle : πA = π ⇔ πA − π = 0
Étape 2 – Construction de la statistique de test: La statistique de test peut être construite autour de la variable aléatoire U qui vaut :
Où, sous H0, U suit approximativement une loi normale centrée réduite : U ~(0 ;1).
Étape 3 – Choix du seuil α et intervalle de pari: On choisit le risque α généralement égal à 5 %. On construit ensuite un intervalle de pari (IP) pour U de niveau 1 − α tel que, si H0 est vraie :
En pratique, l’intervalle de pari est construit à partir de la table A pour la valeur retenue du risque α (fig. 13.2). Connaissant p, cette table donne la valeur de up, quantile d’ordre p, telle que :
Ainsi, pour α = 0,05, l’intervalle de pari se situe entre [− 1,96 ; + 1,96].
Étape 4 – Construction de la règle de décision: La règle est construite autour de H0. Le principe est de considérer a priori que H0 est vraie. On étudie le degré de compatibilité de la valeur observée du paramètre sur l’échantillon avec sa valeur théorique :
• si u appartient à l’IP1–α on ne rejette pas H0 ;
• si u est en dehors de l’IP1–α on rejette H0 et on accepte H1.
Étape 5 – Recueil des données, vérification des conditions de validité du test, et calcul de la statistique de test: Les données de l’expérience fournies dans l’énoncé étaient les suivantes :
• pour l’échantillon son effectif et le pourcentage de complications sévères : na = 120 et pA = 15 %;
• le pourcentage de référence de complications sévères : π = 10.%
Les conditions de validité sont telles que :
Les conditions de validité du test sont donc réunies.
Nous pouvons calculer u, réalisation de la variable aléatoire U :
B Comparaison de deux proportions sur deux échantillons indépendants
L’estimation de δ est D = PA−PB.
Sous H0, l’espérance de D : E(D) = E(PA − PB) = (π0 − π0) = 0.
On calcule ensuite la variance de la différence entre les proportions V(D) :
2: Exemple Dans une étude menée par l’Assurance maladie, le taux de complications sévères après une intervention chirurgicale est le suivant :
• chez 300 patients opérés dans des hôpitaux de grande taille (plus de 500 lits) il est de 8 % ;
• chez 100 patients opérés dans des hôpitaux de petite taille (moins de 500 lits) il est de 15 %.
3: Étapes de mise en œuvre du test statistique Mettons en place un test statistique de comparaison des taux de complications sévères entre les deux types d’hôpitaux, de grande taille et de petite taille. Utilisons la procédure en six étapes que nous avons déjà présentée.
Étape 1 – Formulation des hypothèses à tester: Formulons les deux hypothèses en présence, hypothèse nulle et hypothèse alternative.

Stay updated, free articles. Join our Telegram channel

Full access? Get Clinical Tree


