1. INTRODUCTION
Des méthodes de mesure fiables, normalisées et reproductibles, permettent d’évaluer quantitativement l’altération de l’intelligibilité chez le malentendant. Il reste pourtant difficile d’appréhender qualitativement la valeur d’une dégradation de la discrimination perceptive d’un spectre dynamique de parole.
Pour qu’il y ait compréhension ou intelligibilité d’un message de parole, il faut d’abord qu’il y ait détection du signal puis reconnaissance de ces éléments sonores comme éléments phonétiques. Ce n’est que dans un troisième temps et en fonction des données mnésiques du sujet que ces éléments phonétiques peuvent devenir intelligibles (figure 10.1).
Figure 10.1 D’après J.E. FOURNIER (1951). |
Lors de la phase de détection, les sons perçus ne sont pas identifiés, il peut d’ailleurs s’agir d’autre chose que de la parole. C’est la fonction d’alerte auditive qui est sollicitée. Le sujet reçoit la perception auditive des objets et éprouve une sensation auditive. Au plan de l’audiométrie vocale, le seuil de détection ou Speech Detection Threshold (SDT) est le niveau minimum pour lequel la voix peut être reconnue comme signal au moins 50 % du temps.
La phase de reconnaissance est quant à elle matérialisée par l’action de reconnaitre la présence d’un signal de parole signifiant. Cette étape perceptive fait donc appel aux structures cognitives en nécessitant une connaissance de la langue. Le seuil de reconnaissance, Speech Recognition Threshold (SRT) ou seuil d’intelligibilité est le niveau minimum pour lequel 50 % des mots sont reconnus.
La discrimination fine de la langue est ensuite réalisée dans une dernière étape qui se situe entre le seuil et le maximum d’intelligibilité. C’est cette discrimination fine ou identification qui permet ensuite la mesure des compétences au plan de l’intelligibilité vocale.
2. PERCEPTION DE LA PAROLE ET SEUIL TONAL
2.1. Intelligibilité et seuil tonal
Les normes et les mesures psychoacoustiques permettent de quantifier l’altération de la parole sur le plan quantitatif. Elles s’appuient sur les mesures liminaires.
2.1.1. Mesure des performances vocales
Définition
Le seuil d’intelligibilité en audiométrie vocale (dBH.V. Hearing Vocal) est défini comme le niveau pour lequel 50 % des mots sont répétés. Ce seuil vocal doit correspondre à la moyenne des seuils obtenus en audiométrie tonale (J.E. FOURNIER – 1951, figure 10.2).
Figure 10.2 D’après J.E. FOURNIER (1951). |
2.1.2. Normalisation des mesures vocales
La norme française et européenne : NF EN ISO (389-1-5, 7, 1994a – F), NF EN ISO 8253-3, août 1998 partie 3 : audiométrie vocale, définit le mode opératoire ainsi que les messages vocaux utilisés pour la pratique de l’audiométrie vocale, avec les restrictions de compatibilité pour les cas suivants :
– hors tests spéciaux (enfants) ;
– hors voix naturelle (non enregistrée) ;
– multiplicité du matériel vocal suivant la langue.
Elle définit les modalités qui permettent l’audiométrie vocale par conduction aérienne par l’intermédiaire d’un écouteur, par conduction osseuse par l’intermédiaire d’un ossivibrateur ou en champ acoustique à l’aide d’un haut-parleur.
Elle donne également des prescriptions relatives à l’enregistrement des messages vocaux et recommande les modes opératoires de maintenance et de calibrage de l’équipement vocal. Elle précise les termes suivants :
– le niveau vocal exprimé par le niveau de pression acoustique équivalent par intégration pendant toute la durée du signal vocal avec la pondération fréquentielle C pour les listes d’items isolés. Le Leq peut être estimé en soustrayant 5dB de la valeur moyenne des niveaux de pression acoustique en dB(c) ;
– le niveau liminaire de perception vocal pour lequel le message vocal est perçu mais non compris avec un score spécifié (habituellement de 50 % pour un sujet donné) ;
– le niveau liminaire d’intelligibilité vocale le plus bas pour lequel le score d’intelligibilité est de 50 % ;
– le niveau liminaire d’intelligibilité vocale de référence, la valeur médiane des niveaux liminaires d’intelligibilité vocale d’un nombre suffisamment élevé de sujets otologiquement normaux des deux sexes de 18 à 25 ans inclus ;
– la courbe d’intelligibilité vocale ou « fonction articulaire », la courbe de variation, en fonction du niveau vocal, du score de reconnaissance vocale d’un seul sujet ;
– la courbe d’intelligibilité vocale de référence, la valeur médiane des courbes de variation d’intelligibilité vocale d’un nombre suffisamment élevé de sujets otologiquement normaux des deux sexes de 18 à 25 ans inclus.
Ces dernières définitions rendent compte de la difficulté à disposer d’un matériel vocal et d’une calibration identiques et reproductibles sur différents sites de mesures et à donner des résultats identiques pour un même sujet et suivant le type de matériel vocal utilisé.
Indice de capacité auditive : ICA
L’indice de capacité auditive donne une appréciation des compétences vocales, il s’agit de la moyenne des scores d’intelligibilité mesurés pour les niveaux de voix faible, moyenne et forte (figure 10.3).
Figure 10.3 |
2.1.3. L’intelligibilité pronostiquée à partir de la mesure tonale
Il existe, chez différents auteurs, des moyens prédictifs pour connaître les compétences vocales à partir de l’audiométrie tonale et calculer l’indice de capacité auditive (I.C.A).
Pour J.E. FOURNIER, le seuil d’intelligibilité mesuré pour des listes dissyllabiques (repère b sur la figure 10.3) doit correspondre à la moyenne de seuils mesurés en audiométrie tonale dans une bande passante dite conversationnelle, sauf cas particulier d’une surdité de perception rétrocochléaire. Dans notre exemple (figure 10.3, repère a), la moyenne des seuils de perception, mesurés en audiométrie tonale sur les fréquences 500, 1000, 2000 et 4000Hz est 42,5dB (20 + 35 + 50 + 65)/4). Le seuil d’intelligibilité doit donc être retrouvé à la valeur 42,5dB HV (sur l’échelle du centre du graphique vocal).
Cet auteur indique, par ailleurs, que le maximum d’intelligibilité doit être situé à 10dB HV au dessus de la valeur du seuil tonal à 2kHz.
Car si vous regardez la vocale du sujet normal, c’est effectivement 20dB HL au dessus du O dB HL mais si l’on prend la grille du milieu en dB HV c’est 10dB au dessus du seuil HV.
Dans notre exemple, le seuil à 2kHz étant situé à 50dB HL, le maximum d’intelligibilité devra être obtenu à 60dB (50 + 10) (figure 10.3, repère c).
FOURNIER propose de calculer l’indice de capacité auditive (I.C.A.) du sujet testé en faisant la moyenne des scores d’intelligibilité obtenus pour les niveaux de voix faible, moyenne et forte fixés par lui en fonction de son propre matériel phonétique (Vpp 30dB HV, Vmf 45dB HV, Vff 60dB HV, L’Indice de Capacité Auditive, AUDIOMÉTRIE VOCALE, P53, MALOINE Éditeur 1951). Ce calcul diffère de celui proposé par DAVIS pour le calcul de l’indice S.A.I. (Social Adequacy Index) qui utilise quant à lui des valeurs différentes pour ces 3 niveaux de voix (Vpp 35dB HV, Vmf 50dB HV, Vff 65dB HV, The Articulation Area and the Social Adequacy Index for Hearing, Laryngoscope, LVIII, 8, Août 1948). LAFON propose également un calcul prédictif des performances vocales à partir de la mesure des seuils aériens (figure 10.4).
On reporte les seuils mesurés à l’audiométrie tonale et on multiplie entre eux les chiffres situés en bas à gauche de chaque seuil.
On obtient la probabilité d’erreurs phonétiques pour 80dB d’émission.
Figure 10.4 (source : Précis d’audioprothèse, Tome I, sous l’égide du Collège National d’Audioprothèse). |
Dans l’exemple, on obtient 0,14 soit 7 phonèmes mal répétés sur 50 dans les listes cochléaires, soit 86 % « d’intelligibilité » ou de reconnaissance avec ce matériel phonétique.
Pour connaître ce score prédit à 40dB avec ce même matériel phonétique, il suffit de reporter les seuils 40dB plus bas. On obtient 0,60 soit 30 phonèmes erronés sur 50 soit un score de 40 % d’identification phonétique.
On peut alors reporter ces scores pour l’ensemble des niveaux sur la représentation de J.C. LAFON.
2.1.4. Prévisibilité par la mesure de l’indice d’articulation
Chez certains auteurs anglo-saxons on utilise comme moyen prédictif de l’intelligibilité, l’indice d’articulation ou ARTICULATION INDEX ou plus récemment nommé SPEECH INTELLIGIBILITY INDEX (abréviation SII).
Définitions
R. BENTLER, D. NIEBUHR (1999)
L’indice/index d’articulation ou d’audibilité (AI pour Articulation Index) est un modèle théorique qui établit un rapport entre l’énergie audible d’un signal de parole et l’intelligibilité.
Origine
Bell Telephone Laboratories après 1918.
Principe
L’énergie contenue dans une bande fréquentielle de tiers d’octave d’un signal de parole émergeant détermine l’intelligibilité dans cette bande.
Les différents modes de calcul de l’index d’articulation
Suivant les auteurs, différents protocoles et modèles mathématiques sont utilisés pour obtenir l’index d’articulation ;
–STUDEBAKER et SHERBECOE (1993), donnent la formule suivante :
AI = P I (f) W (f) df, avec,
P : facteur de « compétence/expérience » de l’orateur ou de l’auditeur
I (f) : importance relative de la fréquence considérée pour le type de matériel vocal utilisé : logatomes, mots monosyllabiques, phrases et diction continue.
Le calcul de l’index d’articulation nécessite d’intégrer les niveaux de seuil, le type de matériel vocal utilisé, les conditions de présentation, etc.
Il s’exprime par une valeur de 0 à 1,0, où 1,0 représente une perception complète du signal de parole. PAVLOVIC (1993), cité dans le Précis d’Audioprothèse Tome II (1999) sous l’égide du Collège National d’Audioprothèse, donne une autre définition de l’index d’articulation.
avec :
– li : coefficient de pondération fréquentielle pour la bande considérée ;
– S/B : rapport signal/bruit dans la bande considérée.
Valeurs de l’index d’articulation obtenues suivant le rapport Signal sur Bruit en decibel
AI | 0 | 0,1 | 0,2 | 0,3 | 0,4 | 0,5 | 0,6 | 0,7 | 0,8 | 0,9 | 1,0 |
S/B dB | −12 | −9 | −6 | −3 | 0 | +3 | +6 | +9 | +12 | +15 | +18 |
Précis d’Audioprothèse, Tome II, chapitre VII, p. 153–154.
ANSI S3.5-1997
Il existe une définition conforme à la norme américaine AMERICAN NATIONAL STANDARD INSTITUTE (ANSI), qui comprend un calcul intégrant les seuils tonals, le matériel vocal. Ces conditions d’environnement et de présentation du matériel vocal, ces paramètres peuvent renseigner une matrice informatique pour le calcul du Speech Intelligibility Index (figure 10.5).
Figure 10.5 |
On obtient un « indice » d’intelligibilité de la parole qui est une valeur normalisée. Ce modèle est également utilisé en pratique dans le domaine des télécommunications pour évaluer l’impact de l’insonorisation des véhicules par exemple.
Selon STUDEBAKER (1999), les scores d’intelligibilité réels décroissent avec l’augmentation des niveaux de présentation au-delà des niveaux modérés. C’est pourquoi, la norme ANSI 1997 inclut un facteur de distorsion LDF (Level Distorsion Factor) qui réduit les scores d’intelligibilité prévisibles quand les niveaux de présentation de parole dépassent 73dB SPL (figure 10.6).
Figure 10.6 |
Le LDF est un coefficient multiplicateur à appliquer au Speech Intelligibility Index.
MUELLER, H.G., KILLION, M.C. (1990)
Ils simplifient l’utilisation au quotidien de l’index d’articulation.
Méthode
On trace l’audiogramme tonal habituel sur un masque représentant un spectre du matériel vocal donné comportant des points plus ou moins dispersés (figure 10.7). Méthode simplifiée pour calculer AI.
Figure 10.7 d’après MUELLER et KILLION, (1990) (source : NORTHERN J.L., DOWNS M.P. [1991] Hearing in children. Baltimore, MD : WAVERLY PRESS). |
Il suffit alors de compter le nombre de points situés sous la courbe tonale (de 0 à 100). En divisant ce nombre par 100, on obtient la valeur de l’indice d’intelligibilité de parole ou SII (ou AI pour Articulation Index).
Pour la courbe rouge, on compte 85 points en dessous, soit un AI = 0,85 (échelle de 0 à 1).
Pour la courbe orange, on compte 28 points en dessous, soit un AI = 0,28.
Les représentations plus approximatives des compétences vocales avec visualisation des sons de parole ou non sur les diagrammes, présentent un intérêt essentiellement pédagogique. Ces graphiques surestiment en général les compétences vocales réelles.
2.2. Approche acoustique
2.2.1. Altération du spectre moyen de la parole
Pour quantifier l’altération produite sur la parole par une baisse d’acuité auditive, il est nécessaire de connaître les éléments quantitatifs de la parole. Comme pour l’évaluation de l’intelligibilité, le spectre moyen à long terme de la parole n’est pas une quantité fixe et universelle. Il est multiple, compte tenu de nombreux facteurs :
– Le matériel vocal employé (différent suivant la langue, le contenu, le nombre, la diversité du ou des locuteurs),
– les conditions d’enregistrement (local, studio, conditions réelles de mesure),
– le procédé d’enregistrement (mesures instantanées, mesures moyennes sur l’ensemble, élimination des blancs, prise en compte des niveaux extrêmes).
Certains auteurs proposent d’utiliser un spectre moyen de la parole mesuré à long terme LTASS – Long Time Average Speech Spectrum (figure 10.8A).
Figure 10.8 |
Les auteurs proposent d’utiliser un calcul pour transférer ce spectre moyen de la parole à travers une amplification. L’intérêt de cette procédure réside, pour les auteurs, dans la possibilité de calculer un indice d’audibilité oreilles appareillées dans différentes situation d’écoute rencontrées par les enfants scolarisés. En fonction des différentes situations acoustiques, la spectre moyen de la parole est plus ou moins altéré, donnant ainsi des indices d’audibilité de valeurs différentes (figure 10.8B).
Lorsque la position ou la taille du locuteur changent, le LTASS se modifie comme par exemple dans le cas de l’écoute d’une voix d’enfant (figure 10.9). Pour quantifier les altérations de la parole subies par le malentendant, il faut recourir à ces différents modèles de visualisation du spectre moyen à long terme de la parole.
Figure 10.9 |
En présence d’une perte auditive, la dégradation du seuil tonal va avoir pour conséquence de tronquer le spectre moyen à long terme de la parole en réduisant d’abord la perception des signaux de niveau faible contenus dans le spectre.
Les éléments fréquentiels pour lesquels la perte auditive est plus importante seront altérés. Si la perte touche sélectivement les hautes fréquences, la discrimination des éléments aigus sera difficile dans un environnement sonore complexe.
La figure 10.10 illustre ce phénomène. Les fréquences sont en abscisses et les niveaux physiques d’intensité sont en ordonnées croissantes vers le bas. Les niveaux d’audition statistiques du normoentendant sont représentés en pointillés noirs, du haut vers le bas : seuil tonal monaural normalisé MAF, le Niveau Limite de Confort Conversationnel NLCC et le niveau d’Inconfort. Le spectre moyen de parole est représenté dans la zone conversationnelle entre seuil et NLCC (Most Confortable Level High).