n° 14 : La catégorisation dans les langues

 

présentation générale

Laurent Danon-Boileau* et Mary-Annick Morel**


A quels critères, à quelles régularités répondent les catégories que l'on observe dans une langue? La question mérite d'être posée aussi bien dans le registre du lexique que dans celui de la syntaxe. Toutefois, elle est si vaste qu'elle prête à sourire. Aussi la présente livraison de Faits de Langues ne se propose-t-elle pas de la résoudre, mais seulement de montrer quelques unes des façons que l'on peut avoir de la poser.
Partons du lexique. De quoi dépend le découpage qu'un nom opère dans un champ perceptif? Pour les couleurs, on a pu envisager une sorte de superposition avec les données cognitives. C'était, on s'en souvient, l'hypothèse essentielle de Berlin et Kay. Mais, dans leur article "Pratiques de la couleur et dénominations", Danièle Dubois et Colette Grinevald montrent que la part du culturel est souvent décisive. Dans un nuancier de peinture, par exemple, la même couleur ne porte pas le même nom si on la destine à un peintre en bâtiment ou à un artiste peintre. Et quel que soit ce nom, il doit plus à l'histoire de la teinture qu'au donné perceptif.
Evidemment, on pourrait faire valoir qu'il s'agit là d'un registre linguistique particulièrement tributaire de l'échange culturel et marchand. Mais l'analyse que Marie-Luce Honeste propose de la polysémie ("Un mode de classification sémantique : la polysémie") montre que la catégorisation lexicale opérée par la langue commune, contrairement à la catégorisation scientifique, trouve à s'organiser non pas autour de propriétés inhérentes aux référents, mais autour des expériences qu'une communauté peut en proposer. A ce titre la polysémie souligne l'existence de catégories mentales qui permettent de rassembler des objets très divers entre lesquels le traitement social humain établit des équivalences stables. Cette polysémie qui oscille entre métaphore et métonymie, on la retrouve évidemment dans les premiers temps de l'organisation du lexique de l'enfant dans la période que l'on nomme improprement celle de la surextension, et qui conduit par exemple un enfant à nommer "chien" tout animal à quatre pattes. Il n'est d'ailleurs pas indifférent de chercher à savoir comment un enfant finit par restreindre l'emploi du mot "chien" au seul ensemble des canidés, ou comment, à l'inverse, il peut étendre le mot de "vache" à des images aussi différentes que celle d'un bovidé hilare, emblême d'une pâte fromagère molle, ou encore celle d'une reine des alpages, emblème cette fois d'un chocolat au lait industriel. Ici, il faut bien penser que la dimension de la culture n'est pas absente. Ne serait-ce que dans la façon dont les réponses des parents réorganisent les tentatives spontanées de l'enfant. Ce lien entre catégorisation et acquisition du vocabulaire fait l'objet de la contribution de Mireille Brigaudiot et Laurent Danon-Boileau.
On pourra constraster l'acquisition de l'enfant à la modélisation que propose l'article de Gérard Sabah, qui donne le point de vue d'un informaticien sur les possibilités d'automatisation des procédures de compréhension, d'apprentissage et de catégorisation. Reprenant certaines considérations d'Edelman sur tout système cognitif - c'est-à-dire tout système autonome disposant de perceptions et de possibilités d'actions organisées sur un mode interactif -, Sabah montre qu'un ordinateur parvient à construire des concepts en relation avec ses capacités de mémoire, et que ceux-ci peuvent alors servir de fondement à l'établissement d'un lexique.


DU COTE DU NOM


Entre lexique et syntaxe, il existe traditionnellement une zone intermédiaire, qui est celle de la morphologie préfixale et suffixale. Comme on pouvait s'y attendre, la catégorisation s'y inscrit de manière particulière. En effet un affixe ne définit pas une catégorie univoque: il construit sans doute une valeur circonscrite, mais dans un éventail assez large de domaines distincts. C'est du moins ce que montre Danielle Corbin dans "Pour une théorie sémantique de la catégorisation affixale". Prenant le cas de "sous", elle pose la question du commun dénominateur à "sous" dans "sous-estimer, sous qualifié, sous-officier, sous-ensemble". Certes, la valeur de "sous" est relativement circonscrite : il s'agit constamment d'une localisation qui permet d'inscrire un référent dans une position d'infériorité spatiale par rapport à un repère. Mais l'éventail des lieux d'inscription de cette valeur est large et les registres divers. Tantôt, en effet, si le repère constitue une norme qui n'est pas atteinte, la valeur est d'ordre appréciatif ( c'est le cas pour "sous-qualifié, sous-estimer"). Mais ce peut être aussi le repérage d'une valeur hiérarchique (sous-officier) ou l'établissement d'une subdivision au sein d'un ensemble (sous-ensemble). Et curieusement le strict sens spatial, sans degré ni hiérarchie, se trouve seulement conservé dans les adjectifs techniques tels que "sous-orbitaire". La polysémie est première. Le cas n'est pas sans analogie avec celui de certains suffixes. Ainsi du diminutif, par exemple. Corinne Delhay note à son propos que le diminutif d'un lexème X n'est jamais glosable par "un petit X", et qu'il s'agit plutôt d'une approximation de X. Le diminutif de X désigne une sorte de X, un analogue de X, voire une partie de X. En outre, ce qui sert à établir la comparaison entre X et le diminutif qui lui correspond est une propriété saillante du référent correspondant au diminutif, laquelle n'est pas nécessairement au premier plan dans le référent de X. Reste évidemment qu'au niveau du mot, ce qui définit la valeur sémantique, c'est aussi le statut syntaxique. C'est ce que montre nettement Françoise Kerleroux dans son analyse du procédé de conversion, qu'elle aborde dans le cadre de la morphologie constructionnelle. La conversion en effet ne met en jeu aucun élément morphologique ajouté. Ainsi "marron" hors de tout contexte peut être nom ou adjectif, de même que "marche" est un nom ou un verbe. Ceci lui permet de rappeler que l'objet de la morphologie, l'unité lexicale ou lexème, n'est défini que s'il dispose de trois ordres de propriétés : l'appartenance à une catégorie, une forme phonologique, et un sens lexical. Ces trois propriétés sont indispensables pour réaliser l'individuation des lexèmes. La catégorie syntaxique fait partie intégrante de la définition de l'unité. L'individu mot peut ainsi être défini hors contexte.

Il eût été impossible de traiter de la question de la classification nominale en laissant de côté le problème essentiel que constituent les classificateurs d'un côté, et les langues à classe d'un autre. Dans son article intitulé "Typologie des systèmes de classification nominale", Colette Grinevald tente de brosser une vue d'ensemble du problème. Elle distingue tout d'abord rapidement trois types d'organisations: les langues à classes (comme les langues bantoues). Celles-ci se caractérisent par des marques d'accord nombreuses et contraignantes. A cela s'opposent les langues à classificateurs comme le chinois, lesquelles exigent que toute notion nominale soit associée à un classificateur. A cela s'opposent enfin les langues qui, comme le français et l'anglais, peuvent présenter des "termes de classe" qui ressemblent aux classificateurs sans en avoir ni la systématicité ni, en fait, la fonction. Revenant ensuite en détail sur les classificateurs, elle montre que ceux-ci se répartissent en trois classes principales et que chacune présente des affinités marquées avec certains traits sémantiques. Cette répartition, malgré tout invite au parallèle entre classificateurs du chinois et l'emploi d'un terme tel que "coup" dans "coup de main, de pied, de gnole, etc." en français. Reste alors à déterminer à quelles conditions un nom commun peut devenir classificateur dans une langue qui n'en comporte pas. C'est l'objet de l'article de Céline Benninger. L'auteur montre qu'un terme ne peut devenir classificateur que si un nombre de ses traits peuvent être désactivés et s'il peut mettre son sens au profit de la caratérisation de la configuration spatiale du référent qu'il permet de construire. Dans "chapelet de saucisses", "chapelet" caractérise par métaphore la configuration spatiale d'ensemble, tout comme le lien que chaque saucisse entretient avec celle qui la précède et celle qui la suit.
Maintenant, dans une langue à classificateurs, un classificateur permet-il effectivement un travail de classement, ou n'est-il qu'un préalable de discrétisation nécessaire à un dénombrement ultérieur? C'est l'objet de la réflexion de Thekla Wiebusch dans "Classificateurs et clés: leur rôles respectifs dans l'organisation du sens". En se fondant sur plusieurs exemples précis, dont celui des vêtements, l'auteur rejette l'idée que les classificateurs pourraient correspondre à une fonction catégorisante : une même classe d'objets recourt à des classificateurs différents, sans qu'on puisse y retrouver de critère satisfaisant permettant de construire des sous-classes. Il y a pire : un même classificateur, celui qui signifie "long" par exemple, s'applique indifféremment au pantalon et au short. De sorte que le le classificateur ne catégorise pas les objets. Reste, évidemment, qu'il appréhende les référents d'une certaine façon. Thekla Wiebusch dégage en fait trois polarités: certains classificateurs saisissent l'objet par sa nature ou sa fonction, d'autre par l'une de ses qualités (forme, consistance, taille), d'autres enfin par son mode d'organisation (et distinguent alors entre objet simple et composite, objet complet et objet constituant une partie d'un tout organique). Mais s'agissant de la catégorisation véritable, c'est du côté du système des clés graphiques qu'il faut chercher. Ces signes utilisés par les lexicographes pour classer les mots dans les dictionnaires sont, cette fois, le reflet véritable des catégories essentielles de la culture chinoise.
Comme on le sait, les langues d'Asie ne sont pas les seules où s'observent les classificateurs. Et l'article de Claudine Chamoreau sur les indices catégoriels en phurhépécha, permet de voir quelle peut en être l'évolution. Du XVIe siècle à nos jours, leur nombre se restreint, mais certaines caractéristiques demeurent. La nature du suffixe est déterminée par la configuration du référent. Aujourd'hui, le système distingue seulement entre ce qui est long et unidimensionnel, ce qui est plat et bidimensionnel, et ce qui est rond et tridimensionnel. Mais surtout les conditions d'emploi sont particulières : le suffixe de classe ne peut porter que sur un référent dénombré. Mais il demeure alors facultatif. Il semble alors répondre à une sorte de focalisation de la différenciabilité des objets dénombrés.
On le voit, la problématique des classificateurs est largement traversée par la question de savoir si l'outil construit des catégories ou discrétise le référent en vue d'un comptage. A cette question, la réponse d'Irène Tamba est nette. Elle met en garde contre toute assimilation hâtive entre la fonction grammaticale du classificateur et une réelle fonction cognitive de classification des objets. Réexaminant les arguments fournis par Lakoff (1987) à propos de "hon", classificateur utilisé en japonais pour les objets longs et minces, elle montre que ce marqueur est issu du croisement et de la fusion de quatre auxiliaires numéraux (deux japonais et deux chinois), ce qui explique la diversité de ses emplois. Selon la perspective qu'elle adopte, "hon" ne sert ni à quantifier, ni à classifier. Il fonde l'opération de dénombrement en garantissant la validité de l'appariement de chaque fragment successif du référent avec le mètre qui permet le comptage. L'article d'Alexandre François ("L'illusion des classificateurs") se situe également dans cette perspective de remise en cause de l'effet sémantique du classificateur. Pour appuyer la démonstration, l'auteur prend l'exemple de quatre classificateurs possessifs du motlav (langue de Vanuatu) qui peuvent revêtir quatre formes différentes selon le type d'activité associée à l'objet possédé (nourriture, boisson, charge, possession en général). Ainsi une expression de type "gâteau + classificateur de nourriture" signifie "manger du gâteau", tandis que "gateau + classificateur de charge" signifie "apporter un gâteau". Sur le plan sémantique, on le voit, une communauté de pensée se dessine qui remet en cause la fonction proprement catégorisante d'un grand nombre de classificateurs. Le classificateur ne classe pas les référents. Tantôt il constitue un préalable au comptage, tantôt il définit dans une zone de sens un profil de référent particulier.

Mais on peut également envisager ces différents questions sous le jour de la syntaxe. C'est ce que propose Denis Creissels en comparant le statut des genres dans les langues indo-européenes et celui des classes nominales dans celles du Niger-Congo. Dans les deux cas, les genres et les classes se manifestent par des phénomènes d'accord entre les noms et leurs modifieurs, les noms et les verbes en fonction prédicative, et les noms et les anaphoriques qui les représentent. Pour l'auteur, genres et classes relèvent du même processus de grammaticalisation des marques d'accord, et s'opposent conjointement au système des classificateurs. La contribution de Georges Rebuschi ("Classes nominales et genre dans les langues bantoues") obéit à une inspiration du même ordre. Son propos est d'analyser le poids respectif d'oppositions sémantiques telles que singulier / pluriel et animé / inanimé sur les chaînes d'accord de diverses langues bantoues. Il montre que le sawahili se sépare du chewa, du rundi et du zoulou. Le trait déterminant le codage de l'accord n'est pas le même : en swahili, l'opposition animé / inanimé prévaut sur l'opposition de nombre, c'est l'inverse qui se passe pour le chewa, le rundi et le zulu.

La relation entre accord et genre ou encore genre et nombre intéresse évidemment d'autres langues que les seules langues à classes. Dans son étude sur le genre et les allomorphies flexionnelles de l'allemand, Jacques Poitou montre ainsi que les oppositions de genre ne sont pas directement reflétées pas les variations morphologiques des paradigmes nominaux. Ceci l'amène à procéder à l'inverse en tentant de dégager la valeur des régularités de la morphologie. Ce changement de point de vue l'amène à poser au départ une opposition entre féminin (genre sans marque) et non-féminin de l'autre, le non-féminin se divisant à son tour en masculin et neutre. Mais la valeur des oppositions est alors hétérogène : le genre peut être motivé par une propriété sémantique (ce qui est sexué est masculin ou féminin, ce qui est non-sexué est neutre, ou bien encore ce qui est petit est féminin), ou par une propriété phonétique voire morphologique. A cela s'ajoutent les faits d'évolution diachronique, et notamment les phénomènes de reconstruction de paradigmes.
Le genre est donc une notion complexe. Dans certaines langues, elle tisse des liens remarquables avec le nombre. C'est le cas du roumain. Romana Timoc-Bardy le montre dans son analyse des substantifs ambigènes, c'est-à-dire des substantifs qui ont une forme masculine au singulier, mais plusieurs formes au pluriel : une forme masculine et parfois deux formes fémines. Dans l'analyse proposée, l'auteur s'attache à montrer que la valeur des formes plurielles n'est pas identique. Ainsi un mot masculin signifiant indifférement au singulier "corne" ou "cornet" va se différencier au pluriel : le pluriel masculin désigne les "cornets" ou cors de chasse d'un orchestre, un premier pluriel féminin désigne les cornes d'un animal, tandis qu'une seconde forme plurielle féminine désigne des cornes comestibles, c'est-à-dire des croissants ou des cornets (ce que l'on nomme communément des viennoiseries). Pour tenter d'expliquer ce phénomène de diversification du pluriel, l'auteur recourt à la psychomécanique de Guillaume, qui distingue entre deux types de pluriels: celui qui part de l'unité et la multiplie (pluriel externe), celui qui conserve de l'ensemble la vue globale d'une foule dont les éléments ne sont pas totalement détachés (pluriel interne). A la pluralité externe correspond le pluriel masculin constituant une classe d'entités identiques (les cors de chasse). A la pluralité interne correspondent les deux suffixes de féminin, l'un servant à identifier une collection figurale stable (les cornes d'un animal), tandis que l'autre marque les éléments qualitativement différents au sein d'une collection toutefois instable (les viennoiseries). Comme on le voit, il est passablement difficile de rapporter uniquement l'opposition de genre à une opposition sexuée. C'est également le point de vue développé par Amina Mettouchi dans son analyse du "t", réputé traditionnellement marque de féminin en berbère (kabyle). L'auteur montre qu'il s'agit là d'une formation récente. La valeur initiale de "t" ne semble pas être la marque d'une différence sexuée, mais plus généralement l'indice d'une différenciation, d'un écart par rapport à un repère, le repéré étant alors investi de manière privilégiée par l'énonciateur. Ceci permet de saisir que "t" se retrouve dans les dérivations diminutives, où le féminin apparaît comme la marque d'une modalisation appréciative (un genou de femme par opposition au genou vu sous un aspect clinique), mais aussi dans les dérivations partitives permettant d'extraire un élément dans une collection (un arbre dans une forêt). Ce ne serait donc que dans un deuxième temps que la marque a servi pour le genre et pour marquer une différence sexuée. Témoin le fait que, dans le registre des indices de personnes, le "t" renvoie à deux niveaux de différenciation : il permet d'opposer "tu" à "je", mais il distingue aussi, à la troisième personne, le féminin du masculin.


DU COTE DU VERBE


La présentation des questions afférentes au processus de catégorisation dans les langues aurait été incomplète si l'on n'y avait pas examniné ce qu'il en est dans le registre du verbe. C'est l'objet de l'article de Jean-Pierre Desclés, qui porte précisément sur la catégorisation verbale. Son propos est d'établir une classification des verbes organisée à partir des principes cognitifs sur lesquels reposent, selon lui, l'ensemble des organisations définies par le langage. Il propose quelques éléments qu'il applique aux verbes du français. C'est sa grille d'analyse que Suzy Platiel met à l'épreuve des particularités du verbe san. Morphologiquement, celui-ci se caractérise par la présence obligatoire d'un prédicatif d'existence sur lequel portent toutes les marques temporelles et aspecto-modales. Par ailleurs, il est souvent formé par composition associant notamment les noms des parties du corps à un radical de nature prédicative. Ainsi "esprit + sortir" signifie "oublier", "fesses + mettre" signifie "trahir" (soit dit par équivalent euphémique). Dans cette langue, c'est donc le prédicatif qui assure la fonction cohésive et assertive du prédicat, et, par voie de conséquence, c'est à partir du nominal sujet auquel s'associe le prédicatif (et non pas du verbe) que doivent s'analyser les relations entre les différentes composantes de l'énoncé, y compris le verbe. C'est également à partir des nominaux que se réalise la construction du sens des verbes. On comprend aisément qu'une langue ayant des propriétés si spécifiques ne se laisse pas réduire simplement aux catégories proposées par Desclés à partir du français, même si celles-ci conservent une incontestable pertinence. Enfin, le numéro s'achève sur l'article de Jacques François, qui propose une classification des opérateurs de repérage chronologique du français et souligne que la catégorie du temps, tout autant que celle de l'espace trouve à s'appuyer sur des considérations de nature cognitive.


* Université Paris V et CNRS LEAPLE
** Université Paris III, EA 1483 Recherche sur le français contemporain

voir aussi

 

  • Commander le numéro (versions DOC, PDF)