Dans l’un de nos articles précédents, nous nous sommes rendus compte que la linguistique conçue et appliquée par Chomsky au MIT (Massachusetts Institute of Technology) et dans d’autres campus américains prestigieux est bien une science à proprement parler. La science vise à étudier les lois et les principes en mettant l’accent sur les manifestations de phénomènes physiques. Victimes de l’emprise magique qu’il a sur l’expérience humaine, de nombreuses personnes oublient que le langage, dans sa manifestation la plus directe, appartient au monde matériel.
La phonétique, qui constitue probablement la branche de la linguistique la plus ancienne et la plus avancée, est concernée par la classification ainsi que par les mécanismes de production des sons linguistiques humains. Il existe des chambres fortes qui abritent d’immenses bibliothèques où l’on peut encore trouver des enregistrements sonores qui vont des sons les plus courants tels que le [p] aux plus rares et exotiques, comme les clics africains. Les sons linguistiques les plus simples à prononcer pour les humains sont suffisamment difficiles à étudier pour défier les esprits les plus audacieux. Mais pas question de se résigner : en effet, parmi les personnalités tenaces, citons le Professeur Higgins (issu de la pièce de théâtre « Pygmalion », George Bernard Shaw, 1914), qui réussit à enseigner à une fille issue d’un milieu modeste comment vendre des fleurs, avec une prononciation digne d’une grande dame de la société. Comment y est-il parvenu ? Comment a-t-il réalisé cette transformation ? Ce professeur a-t-il été monté de toutes pièces par son auteur ?
On raconte que pour créer ce personnage, Shaw s’est inspiré d’un linguiste en chair et en os qui était capable d’identifier le pâté de maisons dans lequel vivaient ses interlocuteurs, rien qu’en les écoutant parler. Pour certains, cela peut sembler incroyable, irréel. Et pourtant, il est tout à fait possible de réaliser cette prouesse en utilisant les mêmes outils de recherche scientifique testés et approuvés, en utilisant des collectes de données et des analyses ayant constitué les piliers d’une étude rationnelle, au moins depuis Galilée.
Comme tout ce qui se trouve dans la nature, le langage n’appartient pas au vide mais plutôt à un continuum fondé sur l’expérience. Des chercheurs passent des années à recueillir des informations dans une zone géographique donnée et à produire des taxinomies, des tableaux décrivant les caractéristiques détectées physiquement ainsi que la qualité des phones (voyelles et consonnes) produits par les sujets étudiés. Ces enregistrements ont également été utilisés pour créer des phonogrammes, des diagrammes en forme de vague qui reproduisent des vibrations de groupes de phones discrets à l’intérieur d’un débit de paroles. Une fois qu’une zone linguistique donnée a été étudiée de manière approfondie, un phonéticien va identifier ses interlocuteurs grâce aux types de discours idiosyncrasiques, tout comme l’oreille entraînée d’un virtuose qui réussit à entendre les plus petites variations tonales d’un morceau de musique.
Le logiciel de reconnaissance vocale s’inspire directement de ce type de travail. Lorsque vous tombez sur un répondeur vous affirmant que vous pouvez lui parler, ce n’est pas tout à fait vrai. Il n’existe aucune entité consciente impersonnelle à travers les voies célestes pour vous diriger là où vous souhaitez aller, mais il existe bien un ensemble de programmes automatisés : l’un casse les sons produits par votre voix selon des gammes de vibrations établies, un autre les rassemble en suivant des règles générales de formation de mots, un autre compare les mots tout juste restructurés avec le lexique de phrases probables concernant le sujet dont il est question. Une fois que la phrase a été identifiée, une sous-routine spécifique choisit l’une des réponses préenregistrées de manière digitale et vous la transmet directement.