8: Couples de variables aléatoires

8


Couples de variables aléatoires



Ce chapitre est consacré à l’étude simultanée de deux variables aléatoires. L’intérêt d’une telle approche réside principalement en la recherche d’un éventuel « lien » entre ces deux variables. En effet, dans le domaine particulier de la santé, l’association entre deux variables est essentielle à rechercher car elle peut permettre la compréhension de la variabilité de l’une par rapport à la variabilité de l’autre. Ainsi, on sera intéressé de savoir par exemple, si le fait d’être exposé à un certain polluant est « lié » à la présence ou non de problèmes respiratoires, si les habitudes alimentaires ont un impact sur la mesure de l’indice de masse corporelle… Deux cas seront étudiés dans ce chapitre : le cas où les deux variables aléatoires sont quantitatives discrètes et le cas où les deux variables aléatoires sont qualitatives.



I Loi d’un couple de variables aléatoires discrètes finies



A Loi conjointe


On suppose ici avoir X et Y deux variables aléatoires discrètes finies. La première, X, peut prendre n valeurs (X ∈ {x1,…, xn}) et la seconde, Y, peut prendre m valeurs (Y ∈ {y1,…, ym}). Le nombre de valeurs possibles du couple (X, Y) correspond au nombre de croisements possibles entre les différentes valeurs possibles de X avec celles de Y, ce nombre vaut donc nm. Ces différentes possibilités sont usuellement représentées sous forme de tableau.



image



Une loi de probabilité est définie et donc, d’après le théorème des probabilités totales, la somme doit faire 1 soit image.


Pour définir la loi de probabilité d’un couple, l’ensemble des cases du tableau précédent doit être complété.



image




B Lois déduites de la loi conjointe : lois marginales, lois conditionnelles et loi produit



1 Lois marginales





image


On les appelle « lois marginales » car elles se trouvent en marge du tableau. Ce sont des lois de probabilité donc image et image.


De plus, si X et Y sont des variables quantitatives, on peut calculer les espérances et variances de X et de Y à partir de ces lois marginales c’est-à-dire :


image



Lors de l’étude de deux génotypes, une question importante est l’indépendance ou non entre ces deux génotypes. En effet, cette information permet de déterminer une possible liaison entre les gènes. Ici, nous pouvons montrer qu’effectivement, les répartitions de ces deux génotypes ne sont pas indépendantes. En effet, un seul contre-exemple suffit pour montrer la non-indépendance. Prenons le cas X = 0 et Y = 1 : comme P(X = 0, Y = 1) = 0, P(X = 0) = 0,25 et P(Y = 1) = 0,5 alors P(X = 0, Y = 1) ≠ P(X = 0) × P(Y = 1).


À partir de la loi du couple (X, Y), beaucoup de lois d’autres variables aléatoires peuvent être déduites en plus des simples lois marginales. Nous étudierons ici la loi du produit.



2 Loi du produit




Conseil : quand on détermine la loi de probabilité d’un produit, il faut commencer par trouver toutes les valeurs zk possibles c’est-à-dire toutes les valeurs possibles du produit de X par Y (il y a au maximum nm valeurs possibles).





II Mesures d’association dans le cas de deux variables quantitatives



A Covariance


Si deux variables ne sont pas indépendantes, on aimerait quantifier la force de dépendance. Les mesures d’association présentées ici ne concerneront que des mesures de cette force dans le cas particulier où le lien entre les deux variables est de forme linéaire.



Les deux formules sont équivalentes mais la première (E[(X − E(X))(Y − E(Y))]) permet d’interpréter la covariance alors que la seconde (E(XY) − E(X)E(Y)) est plus simple lors du calcul de la covariance.


Seul le signe de la covariance est interprétable. En effet, la covariance prend ses valeurs dans image et dépend de l’échelle de mesure des variables X et Y. Le terme (X − E(X))(Y − E(Y)) intervenant dans l’espérance va permettre l’interprétation du signe. En effet, un signe positif indique que les variables sont souvent en même temps soit supérieures à leur espérance soit inférieures à leur espérance (le produit de deux termes de signe positif ou de deux termes de signe négatif étant de signe positif). À l’inverse, un signe négatif indique que souvent, quand une des variables est supérieure à son espérance alors l’autre est inférieure à son espérance. Ces deux cas correspondent aux situations où le lien est proche d’être linéaire entre les deux variables soit avec une pente positive pour un signe positif de la covariance soit avec une pente négative pour un signe négatif de la covariance. Le cas de la valeur zéro peut correspondre au cas d’une pente nulle. Ce dernier cas n’est pas équivalent à l’indépendance entre les deux variables mais peut correspondre à deux situations : soit il n’y a effectivement pas de lien soit s’il existe un lien, il n’est pas de forme linéaire.


Le calcul de la covariance est plus simple avec la deuxième formule de la définition à savoir cov(X, Y) = E(XY) − E(X)E(Y). En effet, pour faire ce calcul, il suffit donc de calculer trois termes, les espérances de X et de Y en utilisant les lois marginales et l’espérance du produit XY en utilisant la loi du produit vue précédemment.


Sur l’exemple 8.1 des deux génotypes, la loi de probabilité de la variable produit XY avait été calculée et se résume dans le tableau suivant.


Stay updated, free articles. Join our Telegram channel

May 9, 2017 | Posted by in GÉNÉRAL | Comments Off on 8: Couples de variables aléatoires

Full access? Get Clinical Tree

Get Clinical Tree app for offline access