n37_presentation - Faits de Langues 2016

n° 37 : La parole : origines, développement, structures

Présentation générale

par Louis-Jean Boë & Jean-Luc Schwartz
GIPSA-lab, UMR CNRS, Institut National Polytechnique,
Université Stendhal, Grenoble

Courriels : louis-jean.boe @ gipsa-lab.grenoble-inp.fr, jean-luc.schwartz @ gipsa-lab.grenoble-inp.fr

Nous avons bien conscience que ce numéro de Faits de Langues aborde des problématiques peu familières des lecteurs habituels de la revue. Notre objectif vise à rendre accessible un ensemble de recherches dans le domaine de la parole qui peuvent ouvrir, pour la linguistique, de nouvelles voies de réflexion. Nous remercions vivement le comité de rédaction d’avoir accepté un tel pari en nous confiant la fabrication de ce numéro.

La ligne directrice qui apparaît explicitement ou en filigrane s’appuie sur une hypothèse forte : le langage n’est pas une construction purement abstraite, il est inscrit dans un processus évolutif au cours duquel les contraintes physiologiques et neurophysiologiques de la parole ont informé une partie des structures phonético-phonologiques. En clair, une partie des unités minimales (syllabes, phonèmes) mises en œuvre dans les langues (les tendances générales) ne relèvent pas totalement d’un choix arbitraire : la forme linguistique est en partie conditionnée par la substance (acoustico-articulatoire). La phonétique expérimentale, la phonologie de laboratoire et de nombreuses autres recherches ayant pour objet la parole présentent un point de vue épistémologique particulier[1] : elles constituent une interface entre le signal échangé et sa valeur symbolique; mais en étudiant la négociation entre ces deux niveaux elles n’accordent aucune primauté à l’un d’entre eux. Les articles de ce numéro tentent de répondre, en partie à des grandes questions qui se posent dans cette problématique :

• Peut-on avancer une matérialité des structures sonores du langage et mettre en évidence des tendances générales ?

• Existe-t-il des unités discrètes dans le signal de parole ? Quelles sont les représentations phonétiques les plus opératoires en terme de production et de perception ?

• Comment ces représentations s’articulent-elles avec le système linguistique ?

• Comment une confrontation entre les potentialités de communication de l’Homme et celles de l’animal peuvent-elles permettre de mieux cerner la nature propre de la parole et les prérequis de son émergence ?

• Comment les données récentes provenant de l’ontogenèse de la parole, du cerveau (neurolinguistique), de l’étude de la communication face à face (multimodalité), peuvent-elles éclairer une partie de ces questions ?

Les domaines de la recherche sont en perpétuelle évolution, particulièrement ceux qui sont très liés à l’expérimentation. Et c’est bien, en l’occurrence, une des caractéristiques de ceux qui prennent la parole pour objet d’étude : avec la naissance de la phonétique expérimentale[2] ils sont, depuis une centaine d’années, à l’affût de nouvelles représentations (notamment dans ce numéro l’Imagerie par Résonance Magnétique, anatomique et fonctionnelle pour le cerveau et le conduit vocal), de nouveaux outils (les réseaux de neurones, les éléments finis pour la biomécanique des cordes vocales et des organes de la production de la parole) et bien entendu l’acquisition de nouvelles données, en particulier sur la description des langues.

Comme conséquence directe, les recherches concernées se caractérisent par des collaborations au sein d’équipes qui allient des compétences complémentaires dans de nombreux domaines et peuvent apporter des angles d’attaques, des méthodologies et des résultats de recherches très complémentaires. La parole peut se concevoir comme un système qui relève de la complexité[3], nouvelle étape de la recherche scientifique, qui impose de fait une pluri(trans)disciplinarité[4].

Les articles ont été suscités pour couvrir – très ponctuellement –les quatre thèmes suivants.

1. La parole dans son environnement phylogénétique

Cette partie s’inscrit dans une nouvelle réarticulation scientifique[5] qui revisite actuellement la problématique de l’émergence de la parole dans des voies très différentes de celles qui ont été explorées au cours des deux siècles précédents en ce sens que ces recherches se veulent libérées de toutes contraintes religieuses, philosophiques, politiques ou institutionnelles.

• L’émergence de la parole. Aspects historiques et épistémologiques d’une nouvelle réarticulation (Louis-Jean Boë, Jean-Luc Schwartz, Jean Granat, Jean-Louis-Heim, Antoine Serrurier, Pierre Badin, Guillaume Captier, Pierre Bessière)

Cet article constitue une sorte d’introduction à cette première partie, en faisant l’analyse de la nouvelle réarticulation. Pour l’espèce humaine, la parole et le langage constituent véritablement une question existentielle qui a déjà donné lieu à d’innombrables mythes, théories, dérives et même à des interdits. Actuellement, le nouveau programme, que l’on peut classer de type naturaliste, se caractérise par une approche multidisciplinaire et implique des méthodes et des données très diversifiées. Mais, comme tout domaine en émergence et au développement rapide, il n’est pas exempt de voies menées sans véritables données, avec des emprunts à des hypothèses fragiles dans des disciplines parties prenantes mais non maîtrisées ou trop simplifiées. Les médias, à l’affût des domaines attracteurs, exercent une pression qui n’est pas toujours constructive. C’est pourquoi les bilans réguliers, les mises en perspectives réflexives ne semblent pas superflus.

En se plaçant prioritairement dans le registre de la parole, les auteurs ne considèrent pas pour autant qu’au cours de l’évolution ce moyen de communication a été premier dans la construction du langage : le geste a pu la précéder, ou geste et parole ont pu émerger dans une dynamique phylogénétique conjointe. N’est donc pas abordée ici pas la question de l’antériorité, ni plus globalement de la datation de cette émergence au cours de la phylogenèse.

Mais, dans tous les cas, il faudra bien essayer d’expliquer comment la parole a pu se mettre en place et est devenue le moyen de communication privilégié d’Homo sapiens. Entre l’hypothèse gestuelle et l’hypothèse orofaciale, les trois articles suivants illustrent tout le parti que l’on peut tirer des études sur la communication des primates et des aspects, de la communication orogestuelle humaine, longtemps négligée.

• L’origine phylogénétique du langage : apports des travaux récents sur la communication vocale des cercopithèques (Alban Lemasson, Stéphanie Barbu)

• Du geste à la parole. De la communication des primates au langage humain (Jacques Vauclair)

À partir de recherches sur les primates (en l’occurrence les cercopithèques et les grands singes) ces deux articles proposent des arguments qui étayent la discussion concernant le mode de communication précurseur du langage : sonore ou gestuel ? Si le débat reste largement ouvert aujourd’hui, c’est en grande partie du fait de l’apparent fossé qui sépare, en dépit de leur proximité phylogénétique et anatomique, les systèmes de communication vocale des primates non-humains et humains. Trois grandes orientations théoriques ont émergé autour de la question de l’émergence et de l’évolution du langage.

La première pose une discontinuité homme-animal : le langage, propre à l’Homme, diffère qualitativement de la communication animale par les propriétés symboliques de la sémantique et de la syntaxe. Celle-ci apparaît, sinon comme la propriété essentielle, au moins comme une composante liée à une faculté unique, la capacité de récursivité.

La seconde s’inscrit dans une continuité homme-animal avec une recherche des précurseurs du langage dans la communication gestuelle, et non dans la communication vocale des animaux. Contrairement aux vocalisations, les gestes des primates non-humains seraient plus intentionnels, flexibles, appris et organisés en séquences. L’hypothèse de l’origine gestuelle du langage permet de mettre en évidence l’existence de similarités entre l’homme et les grands singes, mais plus rarement avec les autres animaux.

La troisième propose une continuité entre la parole et le langage et la communication vocale animale à différents niveaux phylogénétiques. Le langage humain pourrait résulter d’une progressive évolution de la communication vocale animale, indissociable de l’évolution de la vie sociale qui fait émerger de nouveaux besoins communicationnels. Pour appréhender le lien entre la vie sociale et la communication, il serait essentiel de ne pas restreindre les analyses aux seules capacités d’articulation et de plasticité acoustique, mais de considérer l’ensemble des facettes de la communication, à savoir la production (la structure acoustique, la perception et la compréhension des signaux et leur utilisation). À partir de l’analyse de la communication des cercopithèques (séparation d’avec les grands singes d’environ 20 millions d’années) est avancée ici, par Lemasson et Barbu, l’hypothèse du son comme précurseur de la parole alors que les gestes et leur organisation cérébrale latéralisée observée chez plusieurs espèces de primates (chimpanzés et babouins) dont l’Homme (dernier ancêtre commun avec le singe entre 6 et 7 millions d’années), plaiderait plutôt, selon Vauclair, pour un système gestuel initial.

• Pointage manuel et vocal : corrélats sensorimoteurs et neurocognitifs, coordination geste manuel/parole (Marion Dohen, Hélène Loevenbruck, Benjamin Roustan et Coriandre Vilain)

La parole est produite, tout à la fois, par des gestes des organes du conduit vocal et par des gestes corporels (notamment des mains). Chez les bébés, le contrôle moteur du conduit vocal est plus long à acquérir que celui de la main, mais les deux systèmes se développent en coopération. Au cours de l’ontogenèse, la modalité gestuelle semble jouer un rôle crucial en ouvrant une « voie royale » vers le langage[6]. Tout ceci confirme le lien fondamental qu’il y semble y avoir entre ces modalités et constitue un argument fort en faveur d’une origine du langage ancrée dans la coordination entre gestes manuels et gestes orofaciaux et met en évidence le rôle central de cette coordination dans la parole.

Dans cet article, les auteurs comparent le mécanisme de pointage par les gestes du doigt avec ceux qui sont liés à des variations acoustiques dues au contrôle du larynx pour le pointage prosodique, du conduit vocal (lèvres, mandibule) pour l’hyper articulation ou par un procédé qui ne nécessite pas de représentation sensori-motrice : une construction lexicale (avec un démonstratif) ou syntaxique. Avec les enregistrements audio-vidéo et des analyses acoustiques traditionnelles (mesure de la fréquence fondamentale, de l’intensité et de l’organisation temporelle), ils mettent en œuvre toute une série de procédures expérimentales très diversifiées : Imagerie par Résonance Magnétique fonctionnelle (IRMf pour la localisation des activités cérébrales), oculométrie (pour le suivi du mouvement des yeux), procédé Optotrack pour le suivi tridimensionnel de marqueurs digitaux et articulatoires (lèvres, mandibule).

Les résultats de la première partie suggèrent que la focalisation prosodique impose un contrôle précis du larynx et du conduit vocal et qu’elle fait intervenir, aussi bien en production qu’en perception, des représentations sensorimotrices très élaborées. Les résultats de la deuxième partie, obtenus grâce à l’IRMf, montrent bien que les pointages gestuels (manuel et oculaire) et le pointage vocal prosodique sont localisés dans le même réseau cérébral. La coordination la plus fine s’opère quand le geste manuel et la focalisation présentent un fort lien fonctionnel. L’apex du pointage manuel est alors aligné temporellement avec des cibles articulatoires plutôt qu’acoustiques. Tous ces résultats montrent bien qu’il existe un lien très fort entre pointage vocal et pointage manuel.

Au cours de son développement chez les bébés et dans la communication parlée entre adultes, le pointage est de nature multimodale et l’on peut supposer que cela a été le cas lors de son émergence chez les primates.

2. La parole dans ses systèmes de perception et d’action

• Le langage commun de la perception et de l’action dans la communication parlée : une perspective neurocognitive (Jean-Luc Schwartz, Marc Sato, Luciano Fadiga)

Comment le cerveau parvient-il à traiter le signal de parole pour extraire les invariants phonologiques et décoder l’information linguistique ? La théorie purement auditive considère que la parole peut être décodée à partir du seul signal acoustique qui contient suffisamment d’informations pour opérer ce décodage, alors que la théorie motrice place les gestes au cœur de ce processus : "la parole est plutôt un ensemble de mouvements rendus audibles, qu’une succession de sons produits par des mouvements" écrivait déjà Stetson en 1928[7]. Presque un siècle après l’énoncé de cette hypothèse, la mise en évidence des neurones miroir et leur fonctionnement suggèrent que le système moteur pourrait jouer un rôle dans la compréhension du langage et, à tout le moins, impose de repenser les relations entre perception et action dans la communication parlée. Cet article tente donc de mieux cerner ce que pourrait être un langage commun de la perception et de l’action.

• La perception des voyelles et des consonnes : de la diversité acoustique à l’isotropie cognitive (Willy Serniclaes, Jacqueline Salinas)

En phonétique, la traditionnelle division en consonnes et voyelles reste malgré tout relativement opératoire[8]. Mais les traits (features) qui caractérisent ces deux classes sont-ils traités perceptivement de la même manière ? Ce débat se prolonge depuis plusieurs dizaines d’années. En particulier la perception du trait de lieu d’articulation qui oppose par exemple les consonnes /b d g/ le long de la dimension avant/arrière du conduit vocal et de la même manière les voyelles /i y u/ relève-t-elle du même traitement cognitif ? La question se pose d’autant plus que ces oppositions de lieu n’ont pas les mêmes conséquences acoustiques (formantiques) pour ces deux types de production. Comment le processus de perception intègre-t-il cette différence dans la récupération du contraste avant/arrière ? Les auteurs montrent qu’un traitement perceptif peut être modélisé par une rotation des frontières dans le plan du deuxième et troisième formant permettant de rétablir l’ordre dans la dimension avant/arrière à la fois pour /i y u/ et /b d g/.

• Modèles biomécaniques pour l’étude de la parole (Pascal Perrier, Yohan Payan, Stéphanie Buchaillard, Mohammad Ali Nazari, Matthieu Chabanas)

L’étude de la production de la parole, de l’anatomie des organes mis en jeu, de leur contrôle peut-elle permettre de mieux comprendre le fonctionnement des structures sonores des langues et leurs évolutions ? La première génération des modèles articulatoires de production de la parole se contentait de générer pour le conduit vocal (de la glotte aux lèvres et à l’orifice nasal) des formes géométriques à deux dimensions, d’en induire les commandes et de relier celles-ci aux articulateurs : la position du larynx, la modification de la forme de la langue, l’ouverture/fermeture du voile du palais, la position de la mandibule et la disposition des lèvres (le degré d’ouverture et la protrusion). Ces degrés de liberté ont pu être interprétés par la suite comme des actions musculaires (synergies). L’apparition de modèles biomécaniques qui rendent compte de la structure des principaux muscles (modèles à éléments finis) et de leurs effets sur la forme du conduit vocal, rendue ainsi descriptible en trois dimensions, permet un véritable progrès dans la compréhension des gestes articulatoires et de leur contrôle. En particulier, les caractéristiques individuelles, les différences hommes/femmes, les conséquences du remodelage de l’ensemble des articulateurs au cours du développement (de la période fœtale à l’âge adulte) peuvent être finement analysées. Pour la pathologie, la chirurgie réparatrice, le traitement orthodontique, il s’agit là d’un outil complexe mais précis. Comme tout procédé de synthèse, la modélisation articulatoire associée à la génération acoustique délivre des stimuli calibrés pour l’étude des conséquences des variations anatamo-physiologiques et du contrôle moteur : somme toute des pistes prometteuses.

3. La parole en développement

• Le babillage et le développement des compétences articulatoires : indices temporels et moteurs (Mélanie Canault, Rafael Laboissière)

Les organes utilisés pour la production de la parole sont apparus préalablement à l’apparition du langage et sont toujours utilisés pour assurer les fonctions vitales de respiration, succion, mastication déglutition. L’hypothèse fondatrice de MacNeilage et Davis[9] (Speech from non Speech), faisant dériver les gestes du babillage chez l’enfant, entre 7 et 12 mois, de la succion-mastication, implique une étape capitale, un réaménagement de l’activité oscillatoire de la mandibule qui conduirait à une différenciation de l’organisation temporelle de cet articulateur pour la production de la parole. En effet, atteindre une cible articulatoire, dans le but qu’elle soit bien perçue et décodée, implique la coordination spatiale et temporelle de plusieurs articulateurs, pour le moins la mandibule, la langue et les lèvres. Cet article se propose de mettre en évidence des indices temporels (rythme oscillatoire mandibulaire) et moteurs (dissociation des déplacements des articulateurs) sous-jacents au développement de l’habileté articulatoire de la mandibule à ce stade.

• Le développement des gestes linguaux dans la production des voyelles. Une comparaison entre les formes de la langue observées et simulées par un modèle articulatoire (Lucie Ménard, Aude Noiray)

On peut relier l’apprentissage de la parole à l’émergence de cartes sensorimotrices dans lesquelles les voyelles et les consonnes sont associées aux configurations du conduit et au son qu’elles produisent. Pour le jeune enfant qui apprend à parler il s’agit de développer ces associations en intégrant les remodelages anatomiques liés à la croissance et aux évolutions de ses capacités motrices, perceptives et, pour tout dire, cognitives. De la naissance à l’âge adulte, la production des voyelles et des consonnes reflète continument les ajustements successifs liés au développement. Pour étudier les conséquences de la croissance il faut pouvoir déterminer le rôle exact de chacune des parties qui entrent en jeu dans la production de la parole aux niveaux moteur, perceptif et plus généralement cognitif. Dans cet article, les auteurs analysent des données, obtenues par ultrason, sur la configuration de la langue dans la production de voyelles, sur deux sujets de 4 et 24 ans. Puis ils comparent ces données avec les prédictions d’un modèle articulatoire incluant un modèle de croissance du conduit vocal.

Neuroanatomie des mécanismes de la communication parlée: un modèle neurophonétique de la production de la perception et de l’acquisition (Bernd Kröger, Stefan Heim)

Les auteurs de cet article présentent l’essentiel d’une approche neurophonétique permettant de modéliser les processus de production, d’acquisition et de perception de la parole pour un ensemble d’items de parole : sons, syllabes, mots et courtes phrases (un modèle de langage). Ils font porter leur description sur la structure neurophonétique du modèle et sur la manière dont les fonctions spécifiques du modèle sont associées à des zones déterminées du cerveau. Le module qui représente les compétences cognitives en linguistique est divisé en une partie procédurale et une partie déclarative. Les formes phonémiques des mots sont sélectionnées à partir d’un lexique mental qui constitue la partie principale de la mémoire déclarative. Après activation de deux modules de planification motrice, le traitement neuromusculaire active un synthétiseur articulatoire de parole qui dispose au fur et à mesure d’un retour sensori-moteur permettant de superviser sa production. Cette rétroaction permet la comparaison entre ce qui est effectivement produit et ce qui a été appris. Lorsqu’apparaît une différence entre ces deux états, un signal d’erreur permet la correction. Le modèle peut être entraîné à babiller à partir de mouvements articulatoires. Après entraînement le modèle peut produire des imitations de signaux acoustiques d’un locuteur.

Enfin, le modèle est neurocomputationnel. En intégrant les connaissances actuelles[10] il associe les traitement de production et de perception à des zones très précises système nerveux central (cortical, subcortical et périphérique).

4. La parole dans la diversité et la cohérence de ses structures phonologiques

Cette quatrième partie, qui ramène les linguistes à des préoccupations qui leur sont plus familières, éclaire particulièrement les relations phonétique/phonologie et certains aspects des théories phonologiques concernant leurs unités et leurs typologies) : a) les sons ou traits prosodiques spécifiques à une zone aréale et aux groupes de langues qu’elle renferme (en l’occurrence l’Afrique); b) la typologie tonale et modélisation phonologique (à partir des systèmes tonals d’Asie orientale); c) les approches théoriques récentes de la phonologie articulatoire qui prennent la syllabe comme un patron de coordination gestuelle.

• La syllabe : objet théorique et réalité physique (Rachid Ridouane, Yohann Meynadier, Cécile Fougeron)

La syllabe est considérée comme une unité fondamentale de la structure suprasegmentale. Mais actuellement se pose encore la question de sa nature exacte et de sa réalisation phonétique. La syllabe est-elle un élément théorique et abstrait qui n’a pas nécessairement de définition phonétique ? Ou, au contraire, s’agit-il d’un objet physique que l’on peut analyser et dont on peut spécifier les paramètres acoustiques et/ou articulatoires. La difficulté de définir phonétiquement la syllabe est en partie liée à sa structure. Dans la majorité des langues du monde qui ont fait l’objet d’études phonétiques, la distinction entre l’élément essentiel et obligatoire de la syllabe (le noyau) et ses marges est presque toujours corrélée avec la distinction entre les sonantes (essentiellement les voyelles) et les obstruantes.

Une partie de l’article est consacrée à la syllabe du point de vue phonologique; sont présentés un ensemble d’arguments motivant son existence comme objet théorique, différents aspects liés à sa structuration interne, le rôle que lui ont assigné différents modèles, sa variabilité dans les langues, notamment celles qui possèdent des syllabes sans voyelle. Puis la syllabe est traitée comme objet phonétique. Après un rappel des conceptions phonétiques anciennes, sont décrites les principales théories motrices de la syllabe, les approches théoriques plus récentes dans lesquelles la syllabe constitue un patron de coordination gestuelle dont il est possible de décrire les propriétés phonétiques de ses sous-constituants.

• Sons africains – In memorian of G.N. Clements (Annie Rialland, George N. Clements)

Le titre de cet article suggère qu’il existe des sons typiquement africains, endémiques de cette partie du monde pourrait-on dire. En effet, les données dont on dispose actuellement montrent bien que certains traits, sons ou éléments lexicaux ou prosodiques ne se rencontrent pas en dehors de ce continent ou qu’ils sont rares en dehors de celui-ci. Ce travail est une synthèse de travaux précédents et plus détaillés[11]. Il apporte aussi des éléments nouveaux concernant certains de ces sons et leur distribution géographique. Les auteurs considèrent : les battements labiaux, les consonnes labio-vélaires, les implosives et les occlusives non obstruantes, les clicks, les harmonies vocaliques fondées sur le recul de la racine de la langue, l’intonation de question "relâchée".

Ces sons ou éléments sonores typiquement africains n’ont pas seulement un intérêt dans leur réalisation phonétique ou pour leur place dans la typologie des sons du langage; l’étude de leurs aires linguistiques dessine leur extension géographique en Afrique. Leurs distributions caractéristiques ont pu être mises en rapport avec celles de traits syntaxiques tels que la présence de pronoms logophoriques observés dans l’aire "soudanique". L’article traite en parallèle deux questions, en fait inséparables, celle des sons typiquement africains et celle des aires linguistiques en Afrique.

• Les systèmes de tons en Asie orientale : typologie, schémas évolutifs et modélisation (Alexis Michaud)

Cet article compare les descriptions linguistiques des systèmes tonals proposées séparément par les spécialistes des langues de l’Afrique sub-saharienne d’une part et ceux de l’Asie, d’autre part. Pour les langues africaines, les tons sont réductibles à des tons ponctuels. Dans les langues asiatiques les tons présentent une grande diversité, notamment en termes de domaine tonal (syllabe ou mot) et de corrélats phonétiques. Si les origines diachroniques des tons de ces deux continents semblent bien établies, ces travaux ne convergent pas quant à leur description et interprétation. Les modèles développés pour les langues africaines ne s’appliquent pas pour les langues asiatiques.

Cet article place les faits observés dans un cadre typologique. Il semblerait bien qu’il existe deux types fondamentaux de systèmes tonals bien différenciés : tons ponctuels, décomposables en niveaux de hauteur, et tons complexes non réductibles à des niveaux. Sur ce point, les résultats les plus récents et l’attention portée à l’évolution des systèmes tonals nous ramènent à une distinction qui avait déjà été proposée il y a plus d’un demi-siècle par Pike[12].

Quelques lignes pour conclure

Une fois achevée la lecture de ce numéro spécial, nous espérons que les lecteurs de Faits de Langues auront pu se faire une idée plus précise des thématiques et des enjeux, et la resituer dans leur perspective propre.

Pour paraphraser le titre de cette revue, nous souhaitons que ces faits de parole, issus des travaux les plus récents et novateurs du domaine, pourront constituer pour les lecteurs de véritables faits de langue (ils le sont indéniablement pour nous !), et que, en retour, les lecteurs voudront considérer avec intérêt cette perspective selon laquelle la Langue serait, au moins pour partie, imprégnée et façonnée de ces faits de parole.

C’est en tout cas notre vœu, comme éditeurs de ce numéro spécial. Bonne lecture !

remarque sur l’absence de bibliographie generale

Compte tenu de la pluridisciplinarité des contributions de ce numéro de Faits de Langues et contrairement à la pratique habituelle de la revue, le comité de rédaction a choisi de ne pas constituer une bibliographie générale et donc de laisser à la fin de chaque article les références des travaux spécifiques mentionnés par les auteurs.

Publié le 18 octobre 2016

n° 37 : La parole : origines, développement, structures

Voir aussi