1. INTRODUCTION
Les éléments sonores des systèmes langagiers ont une grande diversité. Il existe dans le monde, parmi les 4000–6000 langues recensées, 920 sons dont 177 voyelles et 654 consonnes. La plupart des langues contiennent cinq voyelles et vingt-deux consonnes.
Ces mêmes éléments sonores ont toujours fasciné l’homme. Les connaissances articulatoires se sont accrues au fil des siècles. Depuis le IIe siècle avant J.-C., les savants comme Claude GALIEN se sont intéressés à la production de la parole. Au XVIe siècle, Léonard DE VINCI a publié un Traité de la voix. Denis DODART et FERREIN ont écrit des livres sur la voix et les différents « tons » produits. Les travaux de Fabrici d’ACQUAPENDENTE témoignent également de l’attirance de ces savants pour ce phénomène sonore chez l’homme.
Au XVIIe siècle, plusieurs inventeurs en France et en Allemagne tentent de construire des automates parlants. Selon les extraits d’ouvrages scientifiques bien connus de ce siècle et d’un document encore inconnu dans l’histoire de la phonétique et de la synthèse de la parole, un extrait de La Science universelle de l’écrivain français Charles SOREL, l’invention de la synthèse vocale multilingue à vocabulaire illimité est due aux ingénieurs et aux scientifiques de l’Âge classique.
Mais, ce n’est qu’au XVIIIe siècle, que sont approfondies les connaissances sur les sons de la parole notamment dans les domaines physiologiques, acoustiques et articulatoires.
2. ARTICULATION
2.1. Étymologie
Selon le dictionnaire Robert, l’articulation est l’action de prononcer distinctement les différents sons d’une langue à l’aide des mouvements des lèvres et de la langue. Homonyme de « prononciation », le mot emprunté (1478) du latin « articulatio », désigne d’abord la jointure des os formant un assemblage fonctionnel. Vers la fin du XVIe siècle, il s’étendra pour désigner la prononciation nette des sons du langage. Remplaçant un dérivé du verbe « articulement », rapidement sorti d’usage, il se dit pour « énonciation point pour point, article pour article » (1694).
2.2. Anatomophysiologie de la production de la parole
Pour comprendre l’articulation, il faut comprendre l’appareil phonatoire et ses possibilités articulatoires dans l’émission des sons de la parole. Tout acte d’articulation commence par une respiration qui comprend deux phases : l’inspiration et l’expiration. C’est l’air expiré qui est ainsi utilisé lors de la phonation.
Les organes articulatoires s’étendent entre le larynx et la cavité buccale. Le rôle principal de ces organes est avant tout fonctionnel, en tant qu’appareil de survie. Ils contribuent à réaliser l’insalivation, la mastication, la gustation et la déglutition des aliments. L’autre rôle est en tant qu’agent de communication orale.
2.2.1. Larynx
Le larynx (figure 2.1) [11, 12] est situé dans la partie antérieure et médiane du cou. Son squelette est constitué de pièces cartilagineuses articulées entre elles et entre lesquelles sont tendues des membranes : les cordes vocales. Une série de muscles permet d’écarter ou de rapprocher les cordes vocales, ce qui produit un son laryngé1. Le larynx est considéré comme la première cavité jouant le rôle de résonateur.
Figure 2.1 D’après STRAKA G. |
2.2.2. Cavité orale dite buccale
La cavité buccale est la cavité ovoïde qui occupe le tiers inférieur du visage et se situe entre les maxillaires et la mandibule (figure 2.2). Elle est ouverte en avant au niveau des lèvres par la fente orale, en continuité en arrière avec la paroi orale du pharynx au niveau d’une large ouverture, l’isthme du gosier. Elle est délimitée latéralement par les régions amygdaliennes, en haut par le palais mou et en bas par la racine de la langue. Elle est considérée comme la troisième cavité jouant le rôle de résonateur (l’amplificateur du son laryngé).
Figure 2.2 D’après STRAKA G. |
Lèvres
Les lèvres (figure 2.3) [1], supérieure et inférieure, sont des replis musculo-membraneux mobiles situés à l’extrémité de la fente orale. Dans la face externe, elles se présentent en une partie supérieure et une partie inférieure limitant la cavité buccale. La lèvre supérieure présente un sillon médian appelé « philtrum » (sillon sous nasal) limité latéralement par deux saillies, les crêtes philtrales et par le tubercule de la lèvre supérieure appelé « l’arc de Cupidon ».
Figure 2.3 |
Réunies à leur extrémité par la commissure des lèvres, elles contribuent à assurer la contenance salivaire, la préhension des aliments, la respiration par le nez et à changer la forme et le volume du résonateur buccal. Elles ont ainsi un rôle important dans l’exécution des mimiques expressives et dans l’articulation d’un certain nombre de phonèmes, soit par occlusion, soit par projection ou arrondissement.
Dents
Un enfant possède 20 dents de lait qui font leur apparition vers 6–7 mois (avec parfois des écarts selon les enfants). Sur chaque demi-arcade se situent une incisive centrale, une incisive latérale, une canine, et deux molaires.
L’adulte a vingt-huit dents au total (figures 2.4 et 2.5). Elles font leur apparition entre l’âge de 6 et 18 ans et même au-delà. Sur chaque demi-arcade se situent donc une incisive centrale, une incisive latérale, une canine, deux prémolaires, et trois molaires. La dent dite « de sagesse » est une molaire qu’il faut mettre sur le même rang que les autres.
Figure 2.4 |
Figure 2.5 D’après SADANET. |
Les dents sont situées dans les alvéoles des bords alvéolaires, couverts par les gencives, de la mandibule et des maxillaires. Elles servent tout d’abord dans la préhension et la mastication des aliments dans la première phase de la digestion. Chaque type de dents joue un rôle spécifique. Les incisives coupent les aliments, les canines les déchiquettent, les prémolaires et les molaires broient le bol alimentaire.
Mandibule ou maxillaire inférieur
Il s’agit d’une structure osseuse mobile (figure 2.6) qui permet l’exécution de trois types de mouvements : l’ouverture, l’abaissement et l’élévation de la mâchoire inférieure. Cet organe est en rapport avec l’os hyoïde et la langue. L’ouverture de la mandibule entraîne un agrandissement de la cavité buccale par abaissement laryngé. Ses mouvements d’abaissement et d’élévation permettent le rapprochement des organes situés sur le maxillaire inférieur et ceux situés sur le maxillaire supérieur. Il joue un rôle essentiel dans la mastication et la phonation.
Figure 2.6 |
2.2.3. Voûte palatine
La voûte palatine est une cloison qui sépare les fosses nasales en haut, de la cavité orale en bas. Elle est constituée de deux parties : le palais dur (maxillaire et palatin) et le voile du palais ou le palais mou (muscles, aponévrose).
Palais dur (figure 2.1) [3, 4, 5, 6]
Le palais est une partie osseuse recouverte d’une muqueuse avec des glandes salivaires accessoires située à la moitié antérieure et horizontale du palais. Elle est solide et rigide pour pouvoir porter l’arcade dentaire. La région palatine se poursuit en avant et latéralement par la région des arcades dentaires et la région amygdalienne en arrière.
Voile du palais ou palais mou (figure 2.1) [7, 8]
Le voile du palais est un organe fibromusculaire situé presque en perpendiculaire, donc presque vertical, au palais dur. Souple et mobile, il se poursuit par l’uvule (figure 2.1 [9]) connue sous le nom de « la luette » qui pend à la frontière bouche-pharynx. Son bord libre, l’isthme du gosier, permet la communication de la cavité orale avec le pharynx.
Il remplit trois fonctions. Premièrement, la fermeture de la communication entre l’oropharynx et le pharynx lors de la déglutition pour bien orienter les aliments vers le pharynx. Deuxièmement, l’abaissement du voile lors de la phonation pour orienter le passage de l’air vers les cavités nasales ou orales. Dernièrement et indirectement, la synergie tubovélaire lors de l’audition pour participer à l’ouverture et la fermeture de la trompe d’Eustache.
2.2.4. Langue
Dotée de dix-sept muscles, huit muscles pairs, un muscle impair, la langue joue un rôle très important dans l’émission des phonèmes. Elle prend diverses formes et positions telles l’abaissement, la traction, la rétropulsion lors de ses activités (figure 2.7).
Figure 2.7 |
Organe par excellence, la langue est un muscle intervenant dans la phonation, la déglutition, la mastication et porte également l’organe du goût. Située au-dessus de l’os hyoïde, elle est formée d’une partie fixe et d’une partie mobile libre. Plus précisément, la langue est formée d’un dos, d’une face inférieure, d’une racine, d’un apex et de deux bords latéraux.
Dorsum ou dos de la langue
Le dorsum est convexe et s’appuie sur le palais. Il présente un sillon médian longitudinal à la jonction du 1/3 dorsal de cette face. Des papilles gustatives (pour la perception des différentes saveurs : salé, sucré, amer, acide) très développées constituent le sommet et l’arrière. Sa partie postérieure est unie à l’épiglotte par des replis glosso-épiglottiques médiaux et latéraux.
Face inférieure
À la poursuite du sillon médian du dos à la partie antérieure de cette face, la partie postérieure/ inférieure est confondue avec le frein de la langue.
Radix ou racine de la langue
Large, épaisse et fixée sur l’os hyoïde et la mandibule, la racine est en position pratiquement verticale.
Apex ou pointe de la langue
Connu sous l’appellation « pointe de la langue », cette partie est aplatie de haut en bas. Sa forme correspond aux incisives.
Bords
Les bords sont arrondis et prennent la forme des arcades dentaires.
2.2.5. Joues
Les joues constituent les parois latérales (molles) de la bouche qui en avant donnent place aux lèvres. Elles sont délimitées en arrière par le bord antérieur du muscle masséter, un puissant muscle de mastication.
L’action des joues permet un allongement de l’orifice buccal. Ceci ramène les aliments sous les arcades dentaires lors de l’acte de mastication et rétrécit le passage de l’air dans la cavité buccale lors du sifflement et du soufflement.
2.2.6. Pharynx
Le pharynx (figures 2.1 et 2.8 [10]) est un carrefour aérodigestif (musculo-membraneux) entre les voies aériennes (extrémité supérieure de la trachée) et les voies digestives (l’œsophage). Ayant la forme d’un entonnoir, il est subdivisé en trois étages (figure 2.9) : le nasopharynx (en arrière des fosses nasales), l’oropharynx (en arrière de la cavité buccale) et le laryngopharynx (en arrière du larynx). En position de repos, il est béant en permanence. Deux centimètres séparent les parois antérieure et postérieure.
Figure 2.8 |
Figure 2.9 |
Le pharynx joue un rôle très complexe. Son rôle concerne des fonctions vitales :
– lors de la déglutition : le bol alimentaire est chassé vers la partie pharyngo-œsophagienne par la base de la langue s’appliquant contre le palais. Le pharynx prend le relais en s’élevant au-devant du bol puis le pousse vers l’œsophage par les mouvements de contraction ;
– lors de la phonation : le pharynx est considéré comme le deuxième résonateur du son laryngé.
2.2.7. Fosses nasales
Les fosses nasales (figure 2.10) sont deux cavités séparées par une cloison médiane cartilagineuse appelée « cloison nasale ». Elles s’ouvrent vers l’avant par les narines et vers l’arrière, dans le pharynx, par les choanes. Les fosses nasales communiquent encore avec d’autres sinus de la face. Recouvert par la muqueuse respiratoire, l’intérieur de chaque fosse nasale contient trois structures superposées, les cornets, tissus cartilagineux en relief.
Figure 2.10 D’après STRAKA G. |
La fonction respiratoire du nez n’est pas uniquement celle d’une voie de passage. L’air inspiré y est réchauffé, humidifié et purifié. La purification de l’air se fait par captation des impuretés inspirées, grâce au mucus, puis par élimination grâce à un système de cils tapissant cette muqueuse et mobilisant le mucus pollué vers l’extérieur.
La fonction olfactive trouve son origine dans la stimulation de récepteurs sensoriels spécifiques, situés sur le toit de la fosse nasale, par les molécules aromatiques portées par le courant aérien qui balaye les fosses nasales.
La phonation met également en jeu les fosses nasales, de façon accessoire.
3. PHONÉTIQUE
3.1. Description
La phonétique est la science qui étudie les sons de la parole appelés « phonèmes ». Cela concerne la production, la nature physique et la perception des sons de la parole. Il ne faut pas la confondre avec la phonologie qui est la science qui étudie la manière dont les sons sélectionnés sont utilisés et classés, quant à leurs fonctions et à leurs oppositions, dans un répertoire langagier avec pour objectif de donner sens aux sons.
L’étymologie de ce mot vient du mot grec « phônêtikos » « qui concerne le son ou la parole ». Dérivé de « phônein » « faire entendre un son de voix » d’où « parler » et aussi « appeler ». L’élément « phon » est emprunté par dérivation du radical de « phône » « son de la voix ». En 1869, ce mot s’emploie comme substantif au féminin pour désigner l’ensemble des sons d’une langue, du point de vue acoustique ou articulatoire.
3.2. Historique
Les contributions les plus anciennes à cette science sont celles de PANINI, un savant de langue sanskrite en 400 avant J.-C. qui utilisait l’articulation précise des sons de la parole pour préserver les rituels anciens tels qu’ils sont. John WALLIS, mathématicien anglais et un des premiers éducateurs pour les sourds, fut le premier à identifier, quantifier et classer les voyelles. En 1767, grâce à Nicolas BEAUZÉE, l’analyse des modes articulatoires des voyelles et des consonnes a été précisée. Par la suite, le triangle vocalique a été proposé en 1781 par l’Allemand C.F. HELLWAG. Dix ans plus tard, un inventeur hongrois, Wolfgang VON KEMPELEN, allait développer la machine qui produisait les sons de la parole.
Paul PASSY est considéré comme le premier phonéticien français des temps modernes.
3.3. Quelques branches
Phonétique expérimentale : elle mesure et caractérise les activités physiologiques concernées dans la production des sons de la parole ; éventuellement, les analyses des ces sons en utilisant les rayons X, les ultrasons, les photographies et autres méthodes d’imagerie ou les enregistrements électriques mesurant le débit d’air, la pression d’air, les mouvements des organes articulatoires et phonatoires, etc. L’Abbé ROUSSELOT est considéré comme le fondateur de cette discipline.
Phonétique acoustique : elle étudie les caractéristiques physiques du signal sonore de la parole. Le physicien allemand Hermann HELMHOLTZ inaugura cette branche à la fin du XIXe siècle (1863).
Phonétique auditive : elle étudie la manière dont les oreilles et le cerveau détectent, analysent et différencient les sons de la parole. Il ne s’agit pas seulement des caractéristiques physiques des sons, mais également du bagage linguistique ainsi que l’aspect culturel de la personne concernée.
Phonétique articulatoire : elle décrit des sons de la parole en s’appuyant sur une description physiologique observant la manière dont les organes articulatoires se placent et se déplacent pour produire chaque phonème. Ces déplacements sont étudiés en termes de mouvement constant d’un point à l’autre de l’appareil phonatoire.
C’est au travers de cette dernière branche que nous allons aborder la production des phonèmes.
3.4. Phonèmes : unités de la parole
Le phonème est la plus petite unité abstraite fonctionnelle permettant de décomposer et d’identifier les signaux de la parole. Selon VIROLE, ce n’est pas la valeur absolue d’un phonème qui compte mais sa différence avec tous les autres phonèmes du système phonologique auquel il appartient.
Au début de XIXe siècle, la théorie des phonèmes a été avancée par Jan BAUDOUIN DE COURTENAY et par Ferdinand DE SAUSSURE (1916). Ils définissaient le phonème par sa fonction, c’est-à-dire une unité opposite, relative et négative qui n’existe qu’en termes d’opposition. D’autres anthropologues ainsi que des linguistes, tel Leonard BLOOMFIELD, pensaient que cette unité de la parole est un faisceau, une somme, un ensemble de traits distinctifs. Par exemple, le /b/ en français est considéré comme ayant les traits distinctifs suivants : sonore, labial et occlusif. C’est la définition la plus répandue de nos jours. Nicolaï Sergueïevitch TROUBETZKOY (1928) le décrivait comme un ensemble des propriétés pertinentes d’un son. Depuis, d’autres linguistes comme Roman JAKOBSON, Noam CHOMSKY et Moris HALLE ont cherché à décrire les caractéristiques universelles des différents systèmes phonémiques dans le monde entier.
Chaque langue utilise un ensemble particulier de phonèmes pour communiquer et faire la distinction entre les mots. Néanmoins, il y a des ressemblances entre les systèmes phonétiques et phonologiques du monde. Il est généralement accepté que ces ressemblances sont la conséquence d’au moins cinq faits.
3.4.1. La production des phonèmes
Tous les hommes, partout dans le monde, possèdent le même appareil de production de la parole ; en conséquence, les mêmes contraintes de production, mêmes capacités et limites des mouvements des organes phonatoires. L’appareil phonatoire est capable de produire une infinité de sons vocaliques, parmi lesquels chaque langue, selon ses critères et ses règles, va choisir (figure 2.11).
Figure 2.11 |
3.4.2. La perception des phonèmes
La capacité de détection, de discrimination et d’identification des sons, dans les limites du champ de l’audition, est identique pour tous les hommes. Lorsqu’un son est détecté, la sensation perçue dépend à la fois du mécanisme physiologique et psychologique. Par la suite, il faut distinguer le son en opposition à d’autres connus ou inconnus. L’oreille, plus particulièrement la zone de reconnaissance auditive dans le cerveau, est capable de distinguer plusieurs milliers de sons. Enfin, l’objectif de cette perception est d’identifier les sons, les tons et la parole.
3.4.3. L’apprentissage
À la naissance, les nouveau-nés ont la capacité et la facilité d’apprendre n’importe quelle langue. La symétrie favorise l’apprentissage qui commence d’abord par les oppositions les plus simples telles voyelles /a/ et consonnes /p/. Ensuite, viennent les combinaisons syllabiques de type CV. Selon JAKOBSON, un enfant apprend les phonèmes dans l’ordre suivant :
– opposition voyelles-consonnes : /a/ – /p/ ;
– opposition consonne orale-consonne nasale : /p/ – /m/ ;
– opposition consonne labiale-consonne dentale : /p/ – /t/ ;
– pour les consonnes :
• dentales avant palatales : /t/ – /k/,
• occlusives avant constrictives : /p/ – /f/,
• sourdes avant sonores : /f/ – /v/ ;
– pour les voyelles :
• opposition voyelle ouverte antérieure–voyelle fermée antérieure : /a/ – /i/,
• en ordre : /a/, /i/, /u/, /e/, /o/ (les voyelles cardinales).
3.4.4. Le stockage cognitif
Toutes les langues doivent être stockables dans le cerveau, mémorisées et accessibles en temps réel et font appel aux mêmes possibilités cognitives. Le cerveau humain présente une organisation fonctionnelle : certaines parties du cerveau gèrent plus spécifiquement certains aspects du comportement ou de la pensée. Même si cette division fonctionnelle n’est pas stricte, par exemple, au point d’assigner une fonction à une région isolée, il est aujourd’hui possible de dessiner une cartographie du cerveau en aires cérébrales selon leur rôle dans la cognition : les fonctions motrices dans le lobe frontal, la vision dans la partie postérieure du lobe occipital, le langage articulé dans le lobe frontal, au niveau de l’aire de BROCA, etc.
3.4.5. L’objectif d’utilisation
Toutes les langues ont le même objectif principal, celui de communiquer, d’informer, de s’exprimer. L’homme a réussi à donner un autre rôle à son appareil laryngé : à son usage primaire, la déglutition, il a ajouté la vocalisation.
B. LINDBLOM et J.L. SCHWARTZ et al. ont décrit les systèmes vocaliques des langues du monde ainsi que la logique de leur structure. Selon eux, la structure de l’inventaire des voyelles dans une langue n’est pas aléatoire mais suit une logique universelle relative aux contraintes articulatoires et à la distinction nécessaire au sein de chaque système. Chaque langue ne conserve que les oppositions phonologiques utiles et suffisantes pour la compréhension.
Le nombre de phonèmes ainsi que leur classification dans chaque langue varient selon des critères établis. Cependant ce nombre n’est ni fixe ni rigide. Il semble qu’il y ait une évolution dans le temps. Par exemple, au XVIe siècle, la langue française comptait 10 voyelles et 18 sons de consonnes. Deux siècles plus tard, il y avait 14 voyelles.
Aujourd’hui, la langue française compte 26 lettres, dont environ 36 phonèmes regroupés en deux catégories : 16 voyelles et 20 consonnes et semi-voyelles. En anglais, il en existe 40 dont 10 voyelles, six diphtongues (produites par la combinaison ou l’union de deux des voyelles pour former une syllabe, en un seul temps) et 24 consonnes et semi-voyelles. D’autres langues comme le philippin (tagalog) ne contiennent que 21 phonèmes portant cinq voyelles et 16 consonnes.
Les symboles phonétiques API (Alphabet Phonétique International connu en anglais comme IPA : International Phonetic Association) sont utilisés depuis 1993 pour noter une transcription écrite des sons produits. C’est un alphabet reconnu internationalement pour transcrire la prononciation. Il existe aussi d’autres alphabets phonétiques, notamment l’alphabet américain.
3.4.6. Classification des phonèmes
Voyelles
Les voyelles sont reconnues comme des éléments qui peuvent être émis seuls, par la voix (produite par les vibrations des cordes vocales). Selon A. LANDERCY et R. RENARD, leur production résulte du passage libre, c’est-à-dire sans bruit de frottement, du flux laryngé dans le canal vocal.
Dans son étude de 317 langues, N. VALLÉE a trouvé qu’environ 23 % des langues dans le monde possèdent cinq voyelles, 13 % en ont six, 8 % en ont neuf. Une petite minorité en possède trois, huit ou dix. Seules deux langues parmi les trois cent dix-sept n’ont que deux voyelles. Mais, à l’inverse, il existe une langue qui en possède vingt-quatre.
La même étude nous renseigne sur les voyelles les plus fréquentes : 99 % des langues possèdent la voyelle /i/, 98 % possèdent la voyelle /a/ et 94 %, la voyelle /u/. Quelques préférences à noter sont le 44 % avec le /o/ et 40 % avec le /e/. Ces voyelles sont des voyelles « orales », car il n’existe aucune trace de nasalité lors de leur production.
En ce qui concerne les voyelles dites « nasales », le concept en a été une découverte en 1694 par l’Abbé DE DANGEAU. Il les a nommées ainsi puisque la cavité nasale joue un rôle clef dans leur production. Les statistiques de VALLÉE montrent que 22 % des langues possèdent des nasales dont 20 % ont la voyelle /a/ nasalisée, 19 % avec le /u/ nasalisé et 18 % avec le /i/ nasalisé. Trois grandes théories tentent d’expliquer la ressemblance entre les différents systèmes voyellantiques.
Théorie de la dispersion de JAKOBSON (1941) et MARTINET (1955)
Cette théorie explique une tendance naturelle à disperser les voyelles de manière à ce qu’elles soient aussi éloignées que possible les unes des autres. Elles sont largement réparties dans un espace donné. Cette théorie favorise les voyelles situées dans les périphéries du triangle vocalique. Cependant, elle n’explique pas la prolifération des voyelles hautes (situées dans le tiers supérieur du triangle), car elle ne tient pas compte des différentes énergies émises par les formants.
Théorie quantique de K.N. STEVENS (1972) de MIT
Elle accorde un statut égal aux dimensions acoustique et articulatoire de la langue parlée. Les traits sont définis par rapport à certaines dimensions articulatoires à l’intérieur desquelles de petits déplacements de la langue, des lèvres ou des cordes vocales n’ont pas de conséquences acoustiques importantes pour l’oreille. Il s’agit d’un des modèles récents qui réussit le mieux à intégrer la phonétique et la phonologie. Cependant, des recherches supplémentaires doivent être effectuées pour qu’elle soit soumise à une vérification empirique rigoureuse.
Principe de MUAF (Maximal Use of Available Features) de OHALA (1980)
Ce principe est en opposition partielle avec la théorie de la dispersion de JAKOBSON. Selon cette dernière, une langue a tendance à faire une utilisation maximale des traits distinctifs disponibles à un niveau segmental. Le niveau segmental doit être facile à apprendre.
Pour bien étudier ces voyelles, la première représentation vocalique a été conçue en 1711 par BRIGHTLAND. Par la suite, en ce qui concerne la classification des voyelles, certaines langues ont tendance à appliquer un système triangulaire qui utilise trois critères :
– le critère d’aperture : opposition ouverture ou fermeture telle /a/ – /i/ ;
– le critère de lieu d’articulation : opposition antérieure ou postérieure telle /i/ – /u/ ;
– le critère de nasalité : opposition nasale ou orale telle /m/ – /b/.