3 L’information génétique
Comprendre
Introduction
Nous sommes tous issus d’une cellule unique, la cellule œuf, résultat de la fécondation d’un ovule et d’un spermatozoïde. Cette cellule contient toute l’information génétique qui fera de chacun d’entre nous un être vivant unique. Cette information dans sa totalité est transmise dans les cellules lors des divisions cellulaires successives ou mitoses. Cependant, une cellule, selon sa différenciation, n’exprimera qu’une partie de cette information génétique localisée dans son noyau. L’information génétique est contenue dans les chromosomes. Les cellules humaines en possèdent 46 ou 23 paires. Ce nombre est noté 2n = 46 où n est le nombre de paires de chromosomes.
La cellule humaine est une cellule eucaryote mais il existe aussi des êtres vivants procaryotes qui possèdent un matériel génétique dont l’organisation est différente. Cependant les mécanismes de fonctionnement sont très similaires.
La cellule eucaryote et la cellule procaryote
Distinction cytologique (figure 3.1)
La cellule eucaryote se distingue par un noyau vrai délimité par une enveloppe nucléaire et contenant de l’ADN sous forme de chromosomes (voir chapitre 2 : La cellule).
Figure 3.1 Schéma général d’une cellule procaryote
1. Mésosome. 2. Paroi. 3. Membrane plasmique. 4. Cytoplasme. 5. Ribosomes. 6. Chromosome circulaire
Les procaryotes comprennent notamment les bactéries dont certaines sont pathogènes c’est-à-dire responsables d’infections (les mycoplasmes parasites de l’appareil respiratoire sont aussi des procaryotes). La cellule procaryote contient un noyau primitif non délimité par une enveloppe et formé d’un seul chromosome circulaire ou nucléoïde. Elle possède également une paroi riche en lipides, polysaccharides et polypeptides. Le cytoplasme est pauvre en organites, à l’exception des ribosomes, qui sont très nombreux.
Éléments facultatifs
D’autres éléments dits facultatifs ne sont présents que chez certaines bactéries :
Bactéries Gram+ et Gram–
La plus ou moins grande richesse en lipides de la paroi distingue les bactéries Gram+ des bactéries Gram- : les Gram- après coloration au violet de gentiane sont décolorées par l’alcool car la paroi est très riche en lipides. Un traitement à la fuchsine de Ziehl diluée leur donnera ensuite une coloration rouge clair. Les Gram+ ne sont pas décolorées par l’alcool car leur paroi est moins riche en lipides, elles restent colorées en violet. Certains antibiotiques ne sont efficaces que sur l’une ou l’autre des catégories Gram+ ou Gram−.
Les bases moléculaires du matériel génétique
Localisation de l’information génétique
En 1960, le Dr John Gurdon réalise des expériences de transfert de noyau montrant le rôle de cet organite dans l’expression des caractères des cellules et localisant ainsi l’information génétique dans la cellule (figure 3.2).
Nature biochimique de l’ADN
La molécule d’acide désoxyribonucléique (ADN) contenue dans chaque chromosome est le support chimique de l’information génétique.
L’ADN est étudié par diffraction des rayons X dès 1950. En 1953, Franklin et Wilkins obtiennent une image par diffraction qui montre que l’ADN a une structure en double hélice et Watson et Crick propose un modèle moléculaire (prix Nobel en 1962) (figures 3.3 et 3.4). L’ADN est une macromolécule formée de deux brins spiralés. Chaque brin est un polymère de nucléotides ou plus précisément de désoxyribonucléotides.
Un nucléotide est formé de trois constituants (figure 3.5) :
Les nucléotides sont reliés entre eux dans une même chaîne ou brin par des liaisons entre l’acide phosphorique et le désoxyribose formant ainsi une chaîne polynucléotidique avec une extrémité 3’ et une extrémité 5’. L’extrémité 5’est celle où l’acide phosphorique est lié au C5 du pentose et l’extrémité 3’ celle où il est lié au C3.
Les deux brins d’une molécule d’ADN sont reliés entre eux par des liaisons hydrogène entre deux bases complémentaires : la base A s’apparie avec la base T (deux liaisons hydrogène) et la base C avec la base G (trois liaisons hydrogène). Ces liaisons hydrogènes sont de faible énergie c’est-à-dire qui rompent facilement (figure 3.8). Cette complémentarité des bases est universelle, quel que soit l’être vivant considéré, ce qui se traduit dans l’ADN par un nombre de bases A égal à celui de bases T (A = T) et un nombre de bases C égal à celui de bases G (C = G). En revanche, le rapport A + T/C + G n’est pas le même selon les espèces, égal à 1,53 chez l’homme, il vaut 0,91 chez le colibacille (Chargaff, 1950).
Les deux brins de l’ADN sont antiparallèles : l’extrémité 5’ d’un brin fait face à l’extrémité 3’ de l’autre brin.
Une cellule humaine possède donc 46 chromosomes qui correspondent à :
Les deux chaînes d’une molécule d’ADN s’enroulent en double hélice. Le nombre de tours, appelés aussi enlacements, peut varier. Des enzymes, les topo-isomérases, peuvent modifier le nombre d’enlacements dans une molécule d’ADN.
Certains antibiotiques sont des inhibiteurs spécifiques de ces enzymes. Ils ne sont efficaces que sur les cellules bactériennes car les topo-isomérases sont différentes chez la bactérie et chez l’homme. Exemples : le négram, l’urotrate ou encore la noroxine, antibiotiques utilisés dans les infections urinaires.
Certains anticancéreux sont aussi des inhibiteurs des topo-isomérases présentes en grande quantité dans les cellules cancéreuses. Leur action aboutit à la mort de ces cellules. Exemples : le taxol ou encore l’étoposide.
Enroulement et état de condensation de l’ADN
La molécule d’ADN s’associe à des protéines histones pour former des nucléosomes (figure 3.9). Chaque nucléosome est constitué de huit molécules d’histones autour desquelles s’est enroulée sur un tour trois quarts une portion d’ADN longue de 146 paires de bases. L’empilement des nucléosomes donne une structure en « collier de perles » d’un diamètre de 10 nm appelée nucléofilament. Celui-ci s’enroule à son tour pour former une fibre de 30 nm de diamètre appelée solénoïde.
Au cours du cycle cellulaire l’ADN est plus ou moins condensé. Pendant l’interphase l’ADN est visible sous forme de chromatine. Pendant la mitose l’ADN condensé est visible sous forme de chromosomes (figure 3.10).
L’acide ribonucléique (ARN)
L’ARN est un autre acide nucléique nécessaire à la synthèse des protéines. Cette molécule présente plusieurs différences avec l’ADN :
Il existe plusieurs ARN : l’ARN messager ou ARNm, l’ARN ribosomique ou ARNr, l’ARN de transfert ou ARNt et d’autres petits ARN non codants participant à l’épissage (voir La synthèse des protéines, p. 106), à la synthèse d’autres ARN ou encore à leur inactivation voire leur dégradation.
L’ARNm, molécule qui transmet l’information génétique du noyau dans le cytoplasme jusqu’aux ribosomes a une durée de vie très courte. Une séquence de trois ribonucléotides successifs constitue un triplet de ribonucléotides ou codon.
Les ARNr (figure 3.12) qui forment avec des protéines les ribosomes, sont des particules constituées de deux sous-unités, une petite sous-unité de 40 S (S pour « svedberg », unité de mesure de la vitesse de sédimentation) et une grosse sous-unité de 60 S chez les eucaryotes.
Les ARNt (figure 3.13) qui portent les acides aminés véhiculent ces derniers jusqu’aux ribosomes où ils sont incorporés dans la chaîne polypeptidique. Ils contiennent un groupe de trois ribonucléotides successifs ou triplet de ribonucléotides appelé anticodon. Un anticodon s’apparie avec un codon de l’ARNm par complémentarité des bases. L’acide aminé est fixé à l’extrémité 3’ de l’ARNm par une liaison ester (figure 3.14).
L’ADN mitochondrial
Les mitochondries contiennent aussi de l’ADN. Cet ADNmt est circulaire et bicaténaire comme celui des procaryotes. Par contre le code génétique est différent de celui de l’ADN du noyau et les gènes ne contiennent pas d’introns (Voir p. 108). Le génome mitochondrial code certaines enzymes et deux ARNr. Il est transmis par la mère car seules les mitochondries maternelles se retrouvent dans la cellule œuf, celles du spermatozoïde restant à l’extérieur de l’ovule. Cet ADNmt peut subir des mutations transmises de la mère à la fille, par exemple des myopathies d’origine mitochondriale.
La réplication de l’ADN pendant la phase S de l’interphase
Génome et mitose
L’ensemble des gènes, c’est-à-dire des molécules d’ADN contenues dans les chromosomes, constituent le génome. Ce génome est transmis dans chaque cellule fille lors de la mitose. Dans le noyau les molécules d’ADN se répliquent, donnant deux molécules filles identiques formant les deux chromatides de chaque chromosome. Chaque molécule fille migre dans une cellule fille pendant la division. Pendant cette réplication des erreurs peuvent survenir donnant naissance à des mutations qui sont en général réparées.
Propriétés de la réplication
La réplication est semi-conservative : chaque nouvelle molécule d’ADN formée est constituée d’un brin matrice (ou ancien brin) et d’un brin néoformé (nouveau brin).
Elle respecte la complémentarité des bases (figure 3.15).
Elle est bicaténaire et asymétrique : les deux brins de la molécule sont répliqués simultanément. L’allongement du brin en formation (néoformé) se fait dans le sens 5’ → 3’, mais dans la même direction pour les deux brins. Aussi le brin dit « retardé » est répliqué par fragments qui sont ensuite réunis et l’autre brin dit « avancé » est répliqué de façon continue. Ces deux brins sont synthétisés de manière antiparallèle (figure 3.16).
À partir du point d’initiation la réplication est bidirectionnelle formant des yeux de réplication ou boucles de réplication. La réplication a lieu simultanément en de nombreux points sur un même chromosome (figure 3.17). Cette réplication est rapide : 1 000 nucléotides par seconde.
Les différentes phases de la réplication
La réplication se déroule en plusieurs phases.
L’initiation
Elle débute au point d’origines de réplication sur lesquelles se fixent des enzymes : les hélicases. Ces dernières séparent les deux brins en rompant les liaisons hydrogène entre les bases azotées des deux brins complémentaires. Ainsi la molécule d’ADN se déroule. Plusieurs yeux de réplication sont ainsi amorcés.
L’élongation
Elle permet l’appariement par complémentarité des bases de nucléotides libres dans le noyau avec les nucléotides de chaque brin matrice de l’ADN. Il faut des amorces d’ARN pour que commence la synthèse. Ces amorces sont synthétisées par une enzyme l’ARN polymérase ou ARN primase. Elles commencent la synthèse d’un nouveau brin qui est allongé par de l’ADN sous l’action de l’ADN polymérase III. Cette dernière lie les nucléotides libres entre eux formant ainsi le brin néoformé. Les amorces d’ARN sont ensuite hydrolysées et remplacées par de l’ADN par l’enzyme ADN polymérase I. Les ADN polymérases doivent vérifier si le nucléotide qui s’apparie est le bon sinon elles l’enlèvent et le remplacent.
La terminaison
Elle correspond à l’arrêt de la réplication lorsque deux fourches de réplication se rejoignent. Des ligases lient entre eux tous les fragments d’ADN néoformés. Aux extrémités des chromosomes se situent les télomères constitués de séquences répétitives d’ADN. Ces séquences sont peu à peu perdues à chaque réplication. La molécule d’ADN à chacune de ses extrémités est raccourcie d’une dizaine de nucléotides par le fait que l’amorce d’ARN n’est pas remplacée par de l’ADN du côté 5’. Lorsque les chromosomes ont perdu leurs télomères il y a arrêt des divisions. Dans les cellules germinales et les cellules cancéreuses une enzyme, la télomérase, est active (alors qu’elle est inactive dans les cellules normales). Elle permet d’allonger la séquence répétitive située aux extrémités des chromosomes et donc maintient les télomères. Des recherches sur la télomérase sont actuellement en cours pour lutter contre les cancers (figure 3.18).
Les mutations lors de la réplication
Les mutations spontanées sont rares. La réplication fidèle des molécules d’ADN est assurée par les ADN polymérases qui vérifient l’exactitude des nucléotides et assurent leur remplacement en cas d’erreur ainsi que par les systèmes de réparation post-réplicatifs. Cependant quelques rares mutations ne sont pas réparées soit environ trois mutations à chaque réplication du génome humain. Les mutations sont aussi provoquées par des agents mutagènes chimiques ou physiques comme par exemple l’acide nitreux qui transforme des bases azotées en d’autres bases, l’acridine orange qui s’incorpore dans la molécule d’ADN, les UV, les rayons X ou les rayons gamma qui cassent la molécule d’ADN ou bien arrêtent la réplication.
À ces mutations s’ajoutent celles qui ont lieu lors de la transcription (voir La synthèse des protéines).
Les systèmes de réparation de l’ADN font intervenir des enzymes dont la synthèse est sous le contrôle de gènes. L’inactivation de ces gènes peut être responsable de cancers. Le syndrome de Lynch ou cancer du côlon à transmission héréditaire en est un exemple. Les porteurs de l’allèle déficient sont des personnes à risques. Plus généralement, 5 % des cancers du côlon sont héréditaires, en France leur incidence (nombre de nouveaux cas pendant une période donnée) est de 1 200 par an.
D’autres maladies sont dues à des mutations de ces enzymes, par exemple le xeroderma pigmentosum. Dans cette maladie les cellules présentent une sensibilité exagérée aux rayons ultraviolets (UV) responsables de lésions de l’ADN. Les patients doivent donc se protéger de la lumière du jour sinon ils développent des cancers de la peau. Ils sont appelés pour cela les « enfants de la lune ». Ils présentent aussi des troubles neurologiques. Cette maladie se transmet sur le mode récessif, la maladie s’exprime donc uniquement chez les homozygotes, elle est de ce fait très rare.
La synthèse des protéines
L’ensemble du matériel génétique d’une cellule constitue son génome. Ce génome est constitué de gènes, portions d’ADN qui déterminent la synthèse d’une chaîne polypeptidique ou d’une protéine. Les gènes portent les caractères héréditaires. Ils sont constitués de parties codantes les exons (10 % du génome) et de parties non codantes, les introns. La synthèse d’une protéine se déroule en deux étapes situées dans deux compartiments différents de la cellule : la transcription dans le noyau et la traduction dans le cytoplasme au niveau des ribosomes.
La transcription
Mécanisme
Les gènes restant dans le noyau, la transcription permet la fabrication d’une copie d’un gène qui sort du noyau par les pores nucléaires pour se retrouver dans le cytoplasme. Cette copie est sous forme d’ARN messager ou ARNm. Plusieurs ARNm d’un même gène sont fabriqués grâce à plusieurs ARN polymérases qui agissent en même temps sur le même gène (figure 3.20).
Figure 3.20 Unité de transcription
Chaque molécule d’ARN polymérase porte une molécule d’ARN primitif (transcrit primitif)
L’ARN polymérase doit reconnaître une séquence de nucléotides (ou de bases) de l’ADN appelée site promoteur pour se lier à l’ADN. Une fois ce site reconnu, l’ARN polymérase s’y fixe et ouvre la molécule d’ADN (sur une distance de 17 paires de bases) par rupture des liaisons hydrogène : on parle de complexe ouvert. Un brin de la molécule d’ADN appelé brin transcrit ou brin non codant sert de modèle pour la fabrication de l’ARNm. Les ribonucléotides libres viennent se positionner en face des désoxyribonucléotides en respectant la complémentarité des bases (l’uracile se positionne en face de l’adénine). Les ribonucléotides se lient entre eux pour former l’ARNm. La lecture du brin transcrit d’ADN se fait dans la direction 3’ → 5’ donc la synthèse de la molécule d’ARNm dans la direction 5’ → 3’. L’ADN se referme au fur et à mesure de la lecture. L’arrêt de la transcription s’effectue par détachement de l’ARN polymérase (mécanisme mal connu).