v 0.3 Christophe Pallier <http://www.pallier.org>

Un stimulus sonore est transmis par un signal acoustique, c'est à dire une onde longitudinale de pression. Celle-ci fait vibrer le tympan, dont le mouvement est transmis à la cochlée par les osselets situés dans l'oreille moyenne. Un son peut être engendré, par exemple, par le déplacement de la membrane d'un haut-parleur ou par les vibrations des cordes vocales ; il peut être recueilli par la membrane d'un micro et transformé en potentiel électrique.

speech.png
Figure: Oscillogramme et spectrogramme d'une onde acoustique correspondant à un morceau de phrase
oreille_anatomy.png
Figure: Anatomie de l'oreille
auditory_pathways.png
Figure: Voies auditives

Premiers pas avec l'éditeur de son Praat

Pour créer ou manipuler des stimuli sonores, on peut utiliser l'éditeur de son Praat développé par Paul Boersma and David Weenink de l'université d'Amsterdam.

Téléchargez Praat sur le site www.praat.org

Robustesse du signal de parole

L'intelligibilité de la parole est remaquablement robuste aux distortions du signal acoustique.

Par exemple, le signal de parole utilise essentiellement les fréquences comprises entre 100 et 5000 Hz, mais on peut supprimer une large partie de ces fréquences et le signal demeure compréhensible

On peut écréter le signal, voire le discrétiser complétement (remplacant les valeurs positives par +1 et les valeurs négatives par -1) (Licklider 1946, 1950), et il demeure compréhensible.

Quand on interrompt ou qu'on inverse le signal dans des tranches de plusieurs dizaines de millisecondes, la compréhension peut demeurer très bonne (Miller 1950, Saberi 1999).

Cela suggère que le signal de parole est très redondant, et aussi, sans doute, que le cerveau va au delà des données, c'est à dire interprète un signal incomplet.

L'un des arguments les plus souvent cités en ce sens est le phénomène de Il s'agit d'une illusion dans laquelle on entend des sons de parole qui ont en fait été enlevés du signal et remplacés par du bruit blanc. Typiquement, les personnes décrivent entendre une phrase intacte avec un bruit superposé.