Anatomie – Physiologie de la Phonation
C. Ruaux
1. INTRODUCTION – DÉFINITIONS
La phonation est un processus moteur qui assure la production de la voix. La voix est elle-même l’ensemble des sons ou des phonèmes dont l’organisation temporelle constitue la parole, un des matériaux de base du langage, fonction d’expression de la pensée nécessaire à la communication (orale). La phonation est donc le processus moteur qui sous-tend la parole, la fonction motrice qui permet l’expression du langage parlé. Au plan strictement physique, la phonation correspond à l’ensemble des mécanismes qui permettent l’apparition et l’ajustement d’une vibration au niveau du bord libre des cordes vocales.
Un tel système est constitué chez l’homme de trois parties :
– un producteur d’énergie (l’appareil respiratoire) ;
– un vibrateur (les cordes vocales) ;
Bien que classiquement décrites de façon séparée, ces trois parties fonctionnent en étroite relation avec une coordination assurée par le système nerveux central et ses voies périphériques afférentes et efférentes.
Dans ce chapitre consacré au signal acoustique fondamental que devra traiter au mieux l’oreille, nous considérons comme acquises les notions de physique acoustique et de psychoacoustique. En revanche, avant d’aborder les différents volets anatomiques et physiologiques de l’ensemble du système qui concourent à la production de la voix, nous rapportons quelques données utiles à sa parfaite compréhension portant sur les origines du langage et la phylogenèse des organes de la phonation.
2. ORIGINES DU LANGAGE
Après un siècle d’abandon, la question des origines du langage passionne de nouveau les scientifiques. Cette recherche bénéficie des travaux actuels de disciplines aussi diverses que la paléoanthropologie, l’archéologie, l’éthologie, la génétique, les neurosciences, la linguistique, les sciences sociales voire la philosophie.
Le langage dans lequel nous sommes totalement immergés constitue un comportement universel dans notre espèce mais une exception absolue dans le règne animal. Nous sommes les seuls à y consacrer temps et énergie, à communiquer des informations, sans cesse renouvelées, à des individus non apparentés. En quelque sorte, la parole est le propre de l’homme. Pour autant le langage articulé n’est pas apparu parce qu’il fallait que l’on parlât. Il constitue, a priori, un paradoxe à la théorie darwinienne. Pourquoi donner des informations à des congénères concurrents ? Pourquoi la sélection naturelle n’élimine-t-elle pas un comportement qui n’apporte rien à son auteur ? De plus, on ne peut imaginer qu’en raison de pressions de sélection environnementale, qu’elle soit naturelle, sexuelle ou sociale, notre cerveau se soit nanti des capacités cognitives adéquates, alors que simultanément le larynx serait descendu opportunément pour permettre la construction de la parole. Considérer le langage comme une finalité de l’histoire de la vie orientée exclusivement vers l’homme ou liée à une particularité cérébrale propre à notre espèce ne résiste pas aux avancées scientifiques. Une hypothèse classique soutient que l’information serait en fait échangée, au même titre qu’une marchandise, sur la base d’une coopération réciproque ; pour d’autres auteurs la prise de parole serait un moyen d’afficher une qualité particulière : celle de savoir avant les autres.
Il est aujourd’hui établi que le système de communication des hominidés a évolué au travers de deux grandes étapes. La première, remontant à environ moins deux millions d’années (Homo erectus puis Homo sapiens archaïque), correspondrait à l’apparition d’un protolangage, muni d’un lexique de plus en plus riche mais d’une syntaxe rudimentaire ne permettant de communiquer que sur le « ici et maintenant » en s’appuyant fortement sur le contexte pour pallier l’absence de structure syntaxique élaborée. La seconde, datant de moins cent mille ans (Homo sapiens moderne et probablement néandertalien), qui serait spécifique de notre espèce, aurait consisté en l’apparition des structures syntaxiques et autres propriétés complexes à l’œuvre dans le langage (les langues).
Quant à la musique, au chant, deux conceptions s’opposent. Pour la première, l’activité musicale découlerait de l’activité de communication verbale, construite sur la base des ressources cérébrales du langage. Pour la seconde, les compétences perceptives et motrices ayant permis la production de vocalisations puis de formes musicales auraient servi de base à la structuration et au développement de l’activité linguistique. L’homme a-t-il parlé avant de chanter ou inversement ? Ainsi il est établi que l’homme de Cro-Magnon pratiquait la musique mais une flûte datée de moins quarante cinq mille ans serait attribuée à la période néandertalienne ; non seulement il est probable que l’homme de Neandertal parlait mais qu’il était aussi « musicien ».
3. PHYLOGENÈSE
La phonation fait donc intervenir simultanément plusieurs organes mais ceux-ci, pris séparément, assurent chacun d’autres fonctions essentielles. Le larynx, élément central de la production phonatoire, est en fait primitivement dédié au maintien de la perméabilité des voies respiratoires et à la protection de ces dernières lors des phases de déglutition. L’évolution des besoins des mammifères explique le développement de ces nouvelles fonctions. Ainsi, du fait du passage à la vie terrestre imposant des mouvements d’air plus importants on assiste, des poissons primitifs aux crocodiliens, à l’apparition d’une structure d’échange diverticulaire de plus en plus étendue et rigide, bientôt soutenue de cartilages, d’abord en barres latérales puis en U ouverts vers l’arrière, susceptible de s’opposer à l’écrasement par les tissus cervicaux et au collapsus par l’effet BERNOULLI. Pour ce qui est de la protection de cette filière aérienne, on voit apparaître, des animaux marins à poumons aux herbivores, une valve s’opposant à la pénétration d’eau puis un sphincter musculaire, des cartilages mobiles (aryténoïdes) et enfin un certain degré de contact entre l’épiglotte et le palais mou. Cette relation anatomique est particulièrement utile aux mammifères herbivores qui, tout en se nourrissant tête baissée, peuvent continuer à respirer par voie nasale et conserver la faculté de détecter grâce à leur odorat l’approche d’un prédateur. L’australopithèque, les primates et le nouveau-né humain présentent une même disposition. Cela assure entre autre à ce dernier une protection optimale de ses voies respiratoires sous-jacentes contre toute fausse route alimentaire potentielle et lui permet de maintenir sa ventilation concomitamment à ses efforts de déglutition. Durant les premiers mois de vie, l’enfant est donc un respirateur nasal exclusif. Les fonctions vitales de ventilation (nasale) et de nutrition (tétée) seraient privilégiées par rapport aux capacités de communication qui elles, vont devoir patienter jusqu’au développement d’une configuration anatomique plus favorable mais « plus à risque » (descente du larynx). Enfin, grâce à l’apparition des aryténoïdes, les batraciens réalisent une phonation primitive au travers d’un coassement, mais il faut attendre les mammifères insectivores et les primates pour que se développe un larynx anatomiquement complet. Cependant seule la verticalisation propre à l’homme avec la plicature à angle droit du pavillon pharyngo-buccal (retrait de la face et de la mâchoire par rapport au crâne, descente de l’os hyoïde et surtout descente du larynx) va permettre l’articulation vocalique et sa stabilité acoustique que l’on reconnaît comme spécifique au langage humain (figure 1.2).
Figure 1.2 |
4. SOUFFLERIE PULMONAIRE
4.1. Inspiration – expiration normales
Les mouvements de la cage thoracique déterminent la mobilisation d’un certain volume d’air au travers des voies respiratoires, des alvéoles pulmonaires jusqu’à l’axe laryngotrachéal. L’inspiration correspond à une ampliation de la cage thoracique et donc à une augmentation du volume d’air emmagasiné créant un flux d’air « entrant ». Elle nécessite la mise en jeu de muscles inspirateurs. Le principal d’entre eux est le diaphragme, situé à la partie inférieure de la cavité thoracique assurant sa séparation d’avec la cavité abdominale. Les intercostaux externes et moyens, les scalènes et les sterno-cléido-mastoïdiens situés dans les régions latérales du cou sont des muscles inspirateurs accessoires qui n’interviennent que lors d’inspiration forcée. À l’inverse, l’expiration est une contraction de la cage thoracique avec une réduction des volumes s’accompagnant d’un flux d’air « sortant ». Elle est d’abord passive par le simple jeu des forces élastiques de rappel engendrées par les tissus pulmonaires et les parois thoraciques qui tendent à reprendre leur position initiale de repos dite de relaxation. Dans un second temps, elle peut être éventuellement active par la mise en action des muscles expirateurs. Il s’agit des intercostaux internes, petits et grands obliques, grands droits, grands dorsaux et transverses constituant la paroi thoraco-abdominale (figure 1.3).
Figure 1.3 |
4.2. Expiration dans la phonation
Bien qu’il soit possible d’émettre un son sur une inspiration, la production vocale se fait sur le souffle expiratoire. Cette expiration, de passive en phase de ventilation calme devient active et contrôlée. Ainsi, après une inspiration qui dans ce contexte est profonde, on observe un relâchement progressif de la contraction du diaphragme et des intercostaux externes et moyens visant à freiner la fermeture spontanée de la cage thoracique par les forces élastiques de rappel (pression de relaxation). Secondairement, ces mêmes forces élastiques devenant insuffisantes, les muscles inspirateurs cessent leur contrôle et les muscles expirateurs entrent en jeu, intercostaux internes d’abord, muscles abdominaux ensuite (petits et grands obliques) dans le but de prolonger la durée de cette expiration et de maintenir une pression de la colonne d’air sous-glottique suffisante.
4.3. Adaptation du cycle respiratoire
Le cycle respiratoire nécessaire à la phonation est donc différent de celui utilisé en ventilation calme. On assiste à un raccourcissement du temps inspiratoire et à l’accélération du debit d’air inspiratoire (phénomène d’anticipation) au profit d’un temps expiratoire très allongé. Les volumes d’air mobilisés sont augmentés, jusqu’à 60 % voire 90 % de la capacité vitale (5–7l chez l’adulte) pour une voix forte, contre 10 à 20 % (0,5l) lors d’une respiration calme. Les pressions pulmonaires expiratoires augmentent, allant de 3 à 60hPa (ou cm d’eau) selon l’activité vocale pour une moyenne de 7hPa en voix conversationnelle. Elles peuvent être maintenues constantes et adaptées grâce au contrôle sus-jacent du larynx qui exerce un rôle de régulateur de débit (figure 1.4).
Figure 1.4 D’après FRÈCHE (Librairie Arnette). |
5. VIBRATEUR LARYNGÉ
5.1. Anatomie du larynx
Le larynx est une structure tubulaire située à la partie médiane et antérieure du cou, en arrière et sous la base de langue, surplombant la trachée, circonscrite en arrière et latéralement par l’hypopharynx et constituée de l’assemblage de cinq pièces cartilagineuses :
– le cartilage cricoïde réalisant un anneau complet situé juste au-dessus du premier anneau trachéal ;
– le cartilage thyroïde formé de deux lames réunies en avant par un angle dièdre (pomme d’Adam chez l’homme), ouvert vers l’arrière, supporté par le segment antérieur du cartilage cricoïde ;
– le cartilage épiglottique s’intégrant au-dessus et dans l’angle antérieur du cartilage thyroïde ;
– les deux cartilages aryténoïdes, pairs (droit et gauche) et symétriques, placés au-dessus du segment postérieur du cartilage cricoïde fermant l’ouverture postérieure du cartilage thyroïde.
Les deux premières assurent la rigidité du larynx qui peut ainsi demeurer « ouvert » pour la fonction respiratoire. Les trois autres sont mobiles dans le but essentiel de « fermer » le larynx lors des efforts de déglutition, de phonation et musculaires (efforts à glotte fermée tel le soulèvement d’une charge). Cette disposition est rendue possible grâce à des articulations inter-catilagineuses (crico-thyroïdiennes, crico-aryténoïdiennes) et à des ligaments et membranes intrinsèques solidarisant entre-elles ces pièces cartilagineuses (figure 1.5).
Figure 1.5 |
5.2. Éléments extrinsèques
L’ensemble est d’une part suspendu à l’os hyoïde, au maxillaire inférieur et à la base du crâne, d’autre part retenu au manubrium sternal, aux clavicules et aux omoplates par des structures ligamentaires et musculaires extrinsèques (muscles sus- et sous-hyoïdiens). Celles-ci déterminent le positionnement vertical du larynx dans le cou selon la fonction en cours. Elles sont notamment utiles pour l’efficacité des muscles intrinsèques eux-mêmes, le réglage de la hauteur fondamentale (abaissement du larynx pour les graves, élévation pour les aigus) et l’articulation des phonèmes (figure 1.6).
Figure 1.6 |
5.3. Muscles intrinsèques
Les muscles intrinsèques développent leurs insertions exclusivement sur deux de ces pièces cartilagineuses laryngées dont ils assurent la mobilisation et d’où ils tirent leur dénomination. Ils sont au nombre de neuf, la plupart étant paires et symétriques :
– les muscles thyro-aryténoïdiens (muscle vocal) ;
– les muscles crico-aryténoïdiens latéraux ;
– le muscle inter-aryténoïdien (seul muscle impair et médian) ;
– les muscles crico-aryténoïdiens postérieurs ;
– les muscles crico-thyroïdiens.
Il s’agit de muscles striés squelettiques constitués d’un mélange de fibres de types histoenzymologiques différents (I, IIa, IIb), et ce dans des proportions variables d’un muscle intrinsèque à l’autre. Ces différentes populations correspondent aux modes de fonctionnement spécifique de chacun de ces muscles au cours des activités motrices du larynx. Le profil enzymatique est donc propre à chaque muscle. Pour autant, on observe essentiellement des fibres musculaires de type IIa, c’est-à-dire douées à la fois de contractions rapides (thyro-aryténoïdien, crico-thyroïdien) et de résistance à la fatigue (thyro-aryténoïdien, crico-aryténoïdien postérieur, crico-thyroïdien). Ces muscles permettent la mobilisation du cartilage thyroïde et surtout des cartilages aryténoïdes sur le cartilage cricoïde et donc déterminent le degré d’ouverture (abduction) ou de fermeture (adduction) des cordes vocales entre elles ainsi que le réglage de leur tension et raideur, longueur et épaisseur, hauteur et forme de section (figure 1.7 et tableau 1.1).
Figure 1.7 D’après BRASNU, La chirurgie conservatrice du larynx et du pharynx. Monographie Amplifon, 2005, n° 39. |
Adduction | Abduction | Raideur – tension | Raccourcissement – épaississement | Allongement – affinement | Élévation | Abaissement | Bord libre | |
---|---|---|---|---|---|---|---|---|
Thyro-aryténoïdien (vocal) | + (membraneuse) | + (relâchement plans superficiels) | + | + | arrondi | |||
Crico-aryténoïdien latéral | + | + | + | + | triangulaire | |||
Inter-aryténoïdien | + (cartilagineuse) | (+) | ||||||
Crico-aryténoïdien postérieur | + | + | + | + | arrondi | |||
Crico-thyroïdien | + (paramédian) | + | + | + | fin |
5.4. La glotte
Les cordes vocales (ou pli vocal) forment deux reliefs barrant latéralement et sagittalement (d’avant en arrière) la lumière du larynx. Elles s’insèrent en avant, réunies l’une à l’autre, sur l’angle rentrant du cartilage thyroïde et en arrière, séparément, sur l’apophyse vocale de chacun des cartilages aryténoïdes droit et gauche. Dans un plan frontal (vertical), elles délimitent trois régions ou étages superposés dans la lumière laryngée :
– l’étage sus-glottique ou vestibulaire (au-dessus des cordes vocales) ;
– l’étage glottique (entre les cordes vocales), ouvert pour la ventilation ou fermé pour les autres modalités fonctionnelles (phonation, déglutition, effort musculaire) ;
– l’étage sous-glottique (au-dessous des cordes vocales).
La région glottique se subdivise elle-même dans le plan horizontal en :
– un premier segment, antérieur, situé entre le bord libre des cordes vocales proprement dites : la glotte membraneuse ou vocale (participant à la vibration) ;
– un deuxième segment, postérieur, entre l’apophyse vocale de chacun des cartilages aryténoïdes : la glotte cartilagineuse ou respiratoire (non vibrante).
Figure 1.8 |
Figure 1.9 |
Figure 1.10 |
5.5. Histologie des cordes vocales
Depuis les travaux de HIRANO, l’anatomie microscopique, histologique, des cordes vocales apparaît déterminante à la compréhension de leur fonction vibratoire. Ainsi leur portion « ligamentaire » (1/3 moyen) constitue une structure feuilletée comportant à la coupe trois niveaux superposés, avec de la superficie vers la profondeur :
– la couche muqueuse, épithélium malpighien pluristratifié, mieux adapté aux contraintes mécaniques que l’épithélium cylindrique cilié pseudostratifié qui tapisse le reste du larynx et l’ensemble de la filière respiratoire ;
– la couche sous-muqueuse, fibreuse, dite « lamina propria », comprenant elle-même :
• une couche superficielle, l’espace de Reinke, paucicellulaire (rares fibroblastes et fibres élastiques), formé essentiellement de substance fondamentale, jouant le rôle de zone de glissement ;
• une couche intermédiaire, riche en fibres élastiques et fibroblastes, s’épaississant au niveau des zones d’insertion cordale antérieures et postérieures pour former les macula flava. Ces dernières constitueraient des points de régénération et d’amortissement vis-à-vis des effets mécaniques de la vibration cordale ;
• une couche profonde, faite de fibres de collagène et de fibroblastes (ces deux dernières couches formant le ligament vocal proprement dit) ;
– la couche musculaire représentée par le chef « vocalis » (médian) du muscle thyroaryténoïdien.
Chacune de ces strates histologiques possède des propriétés biomécaniques différentes amenant à la constitution d’un vibrateur multicouche. La couche muqueuse et la couche superficielle de la lamina propria forment la couverture, la couche intermédiaire et la couche profonde de la lamina propria réalisent la transition, enfin le muscle constitue le corps du vibrateur. Leur coefficient de rigidité est de plus en plus important, respectivement de 1 – 8 et 10. La couverture est donc plus « mobile » que la transition, qui l’est elle-même davantage que le corps du vibrateur.
Afin de ne pas entacher les capacités vibratoires des cordes vocales, les glandes acineuses assurant leur lubrification sont disposées non pas directement sur leur bord libre mais en périphérie. Des microcrêtes permettent la distribution et la conservation de ce mucus à la surface de l’épithélium cordal. De même, les fibres de collagène, d’élastine ainsi que les vaisseaux sont disposés selon une même direction antéro-postérieure, parallèle au bord libre des cordes vocales et aux fibres musculaires sous-jacentes (figure 1.11A et B).
Figure 1.11 D’après GIOVANNI (EMC). |
6. VIBRATION VOCALE
6.1. Principe de base
De multiples théories ont été proposées pour tenter d’expliquer le mode de fonctionnement des cordes vocales. Aujourd’hui encore c’est la plus ancienne d’entre elles qui sert de modèle fondamental : la théorie myoélastique de EWALD (1898, 1913) reprenant les concepts antérieurs de FERRERI (1741). Ainsi les cordes vocales en position fermée, préphonatoire, créent un obstacle à l’écoulement de l’air expiratoire. Lorsque la pression de la colonne d’air sous-glottique augmente au point de devenir supérieure aux forces de rapprochement des cordes, celles-ci s’écartent pour laisser échapper une petite quantité d’air. La pression sous-glottique baisse alors d’autant. Les forces élastiques de fermeture des cordes vocales étant maintenues, celles-ci peuvent de nouveau s’accoler et la pression sous-glottique augmenter à son tour… Ce cycle peut être poursuivi aussi longtemps que les forces en présence sont entretenues, c’est-à-dire aussi longtemps que la pression expiratoire est suffisante pour vaincre la résistance glottique. Cette théorie répond au principe de résolution d’un conflit élastique entre forces d’écartement (la pression de l’air sous-glottique) et forces de fermeture (contraction musculaire) des cordes vocales. Elle intègre la nécessaire transformation d’un mouvement continu, l’air expiratoire, en un mouvement périodique, l’onde acoustique (figures 1.12 et 1.13).
Figure 1.12 |
Figure 1.13 |
Ultérieurement d’autres théories sont venues enrichir ce modèle, notamment myoélastiqueaérodynamique de VAN DEN BERG (1958), muco-ondulatoire de PERELLO (1962), oscilloimpédantielle de DEJONCKERE (1985), body-cover (corps – couverture) de HIRANO (1985) et TITZE (1988), jusqu’aux travaux les plus récents de OUAKNINE et GIOVANNI faisant référence à divers concepts dont certains méritent d’être rappelés.
6.2. Concepts physiques élémentaires
Les systèmes à masse et à ressort tels un pendule, une balançoire, la corde d’un instrument, une masse suspendue à un ressort, sont des systèmes oscillants linéaires dits harmoniques, passant alternativement et progressivement d’un état à un autre. Ils répondent à la formule [F0 = 1/2π√k/m] où la fréquence d’oscillation (F0) est dépendante de la raideur du ressort (k) et inversement de la masse vibrante (m) mais non de l’énergie délivrée initialement dans le système. Celle-ci doit être introduite régulièrement et très précisément correspondre à l’énergie perdue dans les phénomènes de frottement au risque de dérégler le cycle sinusoïdal. Il s’agit d’oscillateurs harmoniques entretenus. La corde vocale obéit idéalement à un tel système (figures 1.14 et 1.15).
Figure 1.14 |
Figure 1.15 |
Mais pour établir une relation entre énergie et fréquence, il convient d’imaginer un système où l’énergie délivrée initialement de façon continue est successivement accumulée puis brutalement relâchée à un rythme défini par le niveau de cette même énergie devenue ainsi alternative. De tels systèmes sont retrouvés essentiellement dans le secteur de l’électricité et de l’électronique (transistors unijonctions, multivibrateurs astables, tubes fluorescents), mais l’expérience la plus démonstrative est celle du vase de Tantale où la contrainte mécanique est le niveau d’eau, qui augmente continûment grâce à l’arrivée d’eau, puis baisse brutalement lorsque le siphon se déclenche. L’analogie peut également se faire avec une roue à godets, une noria. La fréquence du phénomène alternatif résultant est directement liée au débit continu initial et donc à l’énergie introduite. Il s’agit d’oscillateurs non linéaires, dits à relaxation, au rendement plus faible (frottements) mais plus robuste (simplicité). La corde vocale répond à ce principe de fonctionnement dans une configuration particulière dite « serrée » (figure 1.16).
Figure 1.16 D’après GUERRIER (SFORL). |
Le théorème de BERNOULLI qui répond à l’équation [ρ (v2/2) + ρgz + p = Cte] est un principe de conservation d’énergie adapté aux fluides en écoulement laminaire. Il permet d’expliquer comment la pression d’un fluide diminue lorsque sa vitesse d’écoulement augmente. Ce phénomène peut sembler paradoxal à moins de considérer la pression comme une densité d’énergie. Au passage dans un rétrécissement, la vitesse du fluide (v) et donc sa pression cinétique ou énergie cinétique (ρ (v2/2) doit augmenter, ceci aux dépens de l’énergie de pression ou pression statique (p) (ρgz est la pression de pesanteur ou énergie potentielle considérée ici comme négligeable).