INTRODUCTION
Dans le contexte de la perception auditive du message de parole, au-delà de l’analyse acoustique des événements auditifs en termes d’indices acoustiques ou de traits distinctifs, viennent s’adjoindre d’autres éléments contribuant à la perception du message.
Parmi ces éléments, trois domaines seront ici abordés : la boucle et le contrôle audiophonatoires, la prosodie et la lecture labiale.
Notre objet n’est pas d’étudier de façon exhaustive chacun de ces éléments mais de s’interroger sur leur rôle dans la perception de la parole et notamment de poser les questions suivantes :
– Doit-on considérer ces éléments juxtaposés les uns à côté des autres ?
– Comment peuvent-ils être associés ?
– Ces éléments sont-ils des épiphénomènes de la perception ?
Analyser et structurer la perception : le problème, auquel sont confrontés les théories générales de la parole, est de rendre compte des procédures et représentations qui permettent d’associer un percept phonétique invariant à un signal acoustique essentiellement continu et variable (production, coarticulation).
Trois modes d’approche distincts peuvent être considérés : une approche articulatoire qui fait des gestes articulatoires l’objet même de la perception, une approche acoustico-auditive qui vise à rendre compte de la perception de la parole dans le cadre général de la perception auditive (BROADBENT, OHALA, 1986) et une approche psycholinguistique, dont l’objectif est de préciser comment l’auditeur fait correspondre des unités linguistiques de niveau différent (phonème, mot, phrase…) à un signal acoustique de parole.
BOUCLE ET CONTRÔLE AUDIOPHONATOIRES
Introduction au concept de boucle audiophonatoire, la théorie motrice de la perception de la parole
Il existe des liens entre la perception et la production de la parole.
Au cœur de la théorie motrice de la perception de la parole (TMPP), proposée par LIBERMAN (1996), se trouve l’idée selon laquelle l’objet de cette perception n’est pas construit par le signal acoustique lui-même mais par les gestes articulatoires qui sont à son origine. Autrement dit, si l’auditeur est capable de percevoir de façon adéquate les différents sons de parole et leur combinaison, cela est dû au fait que cet auditeur est capable de « retrouver » à partir du signal acoustique les gestes articulatoires du locuteur.
Ces gestes articulatoires constituent les éléments primitifs de base de la communication parlée. La raison essentielle ayant conduit LIBERMAN à cette hypothèse est que les phénomènes d’invariance et de discontinuité (nature discrète) perceptive semblent être mieux compris à partir de la prise en considération des gestes articulatoires que des propriétés acoustiques du signal de parole (absence d’invariants simples dans la réalisation d’un même son de parole, continuité).
Quels sont les arguments qui permettent de soutenir une théorie portant sur des liens aussi étroits entre la production du geste articulatoire et la perception auditive ?
Cette théorie peut fournir un cadre interprétatif pour rendre compte que notre perception de la parole peut être influencée par les informations visuelles des gestes articulatoires. Ce phénomène avait été mis en évidence par Mc GURK en confrontant le sujet de manière simultanée à un stimulus auditif (une syllabe) et à un stimulus visuel (un geste articulatoire présenté sur un écran de TV). Il avait montré que « ce » que le sujet perçoit du son présenté est déterminé de manière complexe par les deux sortes de stimuli. Ainsi, si le stimulus présenté auditivement est la syllabe « ba » et le geste articulatoire qui lui est associé est celui produit dans la génération de la syllabe « ga », le sujet déclare avoir entendu la syllabe « da ». Le son perçu est alors le « résultat » d’un compromis entre les informations visuelles et auditives (figure 6.1). En effet, du point de vue articulatoire le phonème /d/ se trouve en position intermédiaire entre /b/, le phonème réalisé auditivement, et /g/, le geste articulatoire présenté visuellement. Nous reverrons l’intérêt de cet exemple dans la présentation de la lecture labiale.
Figure 6.1 |
Un autre exemple classique de la connexion entre production et perception est le phénomène de rétroaction auditive avec délai. Imaginons un locuteur écoutant ses propres paroles via des écouteurs. Sa parole est amplifiée et retardée. Lorsque ce délai est de l’ordre de 200ms, le locuteur a de grosses difficultés à parler. Sa parole devient une sorte de bégaiement, avec de nombreuses répétitions et des délais dans l’articulation des sons de parole. Ce phénomène montre que l’insertion d’un décalage temporel entre ce qui est produit par le sujet et ce qu’il entend de sa production affecte cette dernière. Un tel effet traduirait l’existence de connexions entre les deux systèmes, comme il est clair que dans les conditions ordinaires d’utilisation du langage parlé la mise en relation des informations liées à la production et à la perception permet au locuteur de contrôler sa performance.
Dans le modèle de LEVELT, deux boucles de contrôle sont envisagées : une boucle interne et une boucle externe. La boucle interne doit permettre au locuteur de vérifier que ce qu’il va produire correspond à ses intentions linguistiques, tandis que la boucle externe lui permet de vérifier que ce qu’il a déjà produit l’a été correctement.
De la boucle audiophonatoire au contrôle audiophonatoire
On contrôle sa voix par ce que l’on entend. Comme l’a présenté le docteur RUAUX, il existe deux types de contrôle audiophonatoire : volontaire (chanteurs, imitateurs) et involontaire (dépistage simulateurs).
Le contrôle audiophonatoire joue un rôle fondamental dans le développement du langage et dans la gestion de l’articulation. Il se met en place dans les premiers mois.
Vers six mois le babillage s’enrichit, le bébé joue avec sa voix, rend possible la mise en place de la boucle audiophonatoire. On l’observe dans l’évolution de la parole chez l’enfant. L’enfant joue avec sa voix et accroît une richesse du développement prosodique, de l’intonation et de la mélodie du système phonétique.
Ainsi voilà pourquoi contrôler ce que l’on entend prend un sens, d’abord sur la modalité acoustique (gérer l’intensité, la hauteur), puis sur la précision articulatoire.
Les perturbations de ce contrôle vont avoir un impact sur les qualités de la production. Par exemple, des sujets présentant une surdité postlinguale montrent une détérioration de nombreux aspects de la production de la parole : problèmes relatifs à l’intensité, au contrôle du fondamental laryngé, tout comme l’intonation, le débit (ralentissement, accélération, coupures). Cependant, c’est seulement après une longue privation sensorielle que des variabilités dans la production des voyelles et consonnes seront observées (COWIE, 1992).
La mise en évidence que la précision de la production des voyelles et consonnes reste peu altérée pour un temps relativement long après la perte d’audition, tend à mettre en avant l’existence d’un système très organisé entre la production et le message acoustique. D’un autre côté, le fait que la perte auditive affecte plus rapidement des paramètres comme l’intensité et la hauteur implique que les mécanismes engagés dans le contrôle suprasegmental soient différents de ceux du contrôle segmental (PERKEL, 1997). Le contrôle de ces paramètres semble être plus directement sensible au feed-back acoustique, au contrôle audiophonatoire.
Les perturbations du contrôle audiophonatoire sont abordées chez l’enfant par la manière dont la perte auditive va avoir un impact sur le développement de ce contrôle.
Cet impact se mesure dès six mois. Il y a une différence de durée de production au niveau du babillage articulatoire. Cette durée s’affaiblit chez les enfants malentendants et l’on observe une baisse des capacités de répétition syllabique.
Avant la perte de ce babillage, plusieurs observations peuvent être faites sur ce déficit. Pour les enfants sourds, il existe proportionnellement plus de productions bilabiales (sons visualisés facilement au niveau de la bouche des interlocuteurs) et très peu de fricatives (F/Ch).
Ainsi, le contrôle audiophonatoire :
– rend possible la boucle audiophonatoire ;
– est fondamental dans le développement du langage et dans la gestion de l’articulation ;
– joue un rôle dans le contrôle segmental et suprasegmental.
L’approche articulatoire de la perception présentée en préambule ne peut se comprendre que parce que la perception n’est pas un stimulus/réponse mais s’intègre dans les composantes de codage linguistique qui se révèle tôt (et au-delà des points abordés ici comme les modules de traitement catégoriel par exemple, la perception prototypique des voyelles…).
Le contrôle audiophonatoire compris dans cette approche ouvre la voie aux liens entre les aspects segmentaux et suprasegmentaux ; ceci introduit la présentation des données de la prosodie.
PROSODIE
La prosodie est l’ensemble des évolutions acoustiques, des paramètres de hauteur fondamentale, de durée, d’intensité de la parole et de leurs interactions éventuelles (LACHERET-DUJOUR et BEAUGENDRE, 1999).
Elle se détermine par deux aspects :
Get Clinical Tree app for offline access
– paramètres acoustiques :
• fréquence fondamentale (F0 ; hauteur),
• durée des sons et des silences,
• intensité des sons (énergie) ;
– caractéristiques perceptives :
• mélodie,
• rythme : maximum dix syllabes,