Espaces sémantiques et représentation du sens - Hal-SHS

Dans cet espace, le sens de peinture dans un énoncé donné peut être
représenté ... par des relations topologiques de voisinage et de recouvrement
partiel entre les .... En effet, comme nous allons le voir, l'examen de la structure
de l'espace ...

Part of the document


Espaces sémantiques et représentation du sens Bernard Victorri Introduction Les nouvelles technologies de l'information sont en train de transformer
profondément la recherche en linguistique. En effet, l'existence et la
disponibilité de ressources électroniques de grande taille (très gros
corpus, dictionnaires de toute sorte) permettent de développer des méthodes
d'étude de la langue qui étaient encore impensables il y a dix ans.
En particulier, les méthodes statistiques, qui étaient reléguées à des
traitements assez marginaux (analyse de fréquence lexicale dans des études
de textes, par exemple), ont pris un nouvel essor. Leur rôle dans l'analyse
syntaxique et sémantique des textes occupe une place de plus en plus
importante (cf. par exemple, Habert et al. 1997, Habert et al. 1998).
Cela se comprend aisément : appliquées à des données massives et
diversifiées, ces méthodes statistiques permettent d'étudier le
fonctionnement de la langue « en vraie grandeur » : qu'il s'agisse de co-
occurrences d'unité lexicales ou d'acceptabilité de constructions
syntaxiques, le linguiste dispose de données en quantité quasiment
illimitée, il peut construire des modèles basés sur l'analyse de ces
données, et il peut tester les prédictions de ces modèles de manière
objective et fiable. La linguistique contemporaine, qui a, un moment,
cherché à atteindre l'idéal de scientificité que représente la physique
théorique (cf. Milner 1989, Chomsky 1995) en devenant de plus en plus
formelle, est en train d'acquérir un autre statut scientifique, plus
expérimental et plus proche des sciences biologiques. Cette étape est sans
doute nécessaire pour surmonter l'impasse dans laquelle s'étaient engagés
un certain nombre de linguistes, plus attirés par l'élégance des
constructions théoriques que par la dure, et parfois décevante, réalité des
faits linguistiques, qui ne cessent de produire des contre-exemples aux
effets dévastateurs pour ces tentatives de formalisation.
Notre travail s'inscrit dans ce nouveau courant en linguistique. En
utilisant comme ressource électronique des dictionnaires de synonymes, nous
avons cherché à mieux cerner l'organisation sémantique du lexique du
français, et surtout à concevoir un mode de représentation du sens des
unités lexicales (noms, verbes, adjectifs) qui prenne pleinement en compte
la diversité des emplois de ces unités. C'est donc la polysémie, cette
propriété si commune des mots de pouvoir prendre des sens différents
suivant le contexte dans lequel on les utilise, qui est au c?ur de ce
travail. Le phénomène de la polysémie Il faut d'abord noter que la polysémie touche avant tout les mots les
plus courants, ceux qui font partie du vocabulaire de base des locuteurs :
il suffit d'ouvrir un dictionnaire pour s'en rendre compte. Plus un mot est
utilisé dans le langage quotidien, plus il a de chances d'être polysémique.
Qui plus est, ce phénomène est universel : il n'existe pas de langue
humaine qui échappe à cette règle. Il ne s'agit donc pas d'un phénomène
marginal, une sorte de « défaut » résiduel de langues imparfaites qui
tendraient vers un idéal où tous les mots ne possèderaient plus qu'un seul
sens. Au contraire, on doit considérer que c'est une qualité indispensable
au bon fonctionnement du langage. Nous avons besoin de la polysémie pour
pouvoir exprimer ce que nous avons à dire, et, pour notre appareil
cognitif, la polysémie ne représente pas une difficulté supplémentaire à
résoudre pour comprendre le sens d'un énoncé : c'est une caractéristique
« normale » d'un énoncé, et les mécanismes cognitifs à l'?uvre dans la
compréhension du langage traitent avec la même facilité les mots
polysémiques et les mots monosémiques. Cette conclusion, surprenante au
premier abord, peut être expliquée dans le cadre d'une conception dynamique
de la construction du sens (Victorri 1996).
Pour qui s'intéresse au traitement automatique des langues, la
polysémie constitue une difficulté considérable. En effet, lister tous les
sens possibles d'un mot dans un lexique informatisé s'avère impraticable :
d'abord parce que ces listes devraient être pratiquement infinies si l'on
veut tenir compte de toutes les nuances qui peuvent colorer l'usage d'un
mot, mais aussi et surtout parce que l'on perd par cette méthode ce que ces
sens ont en commun, ce qui explique qu'ils puissent être portés par une
même unité linguistique, ce qui fait au fond le « génie » de la langue qui
a produit cette polysémie.
Prenons un exemple (tout à fait banal) : le mot peinture. Ce mot peut
désigner le matériau utilisé pour peindre (ex : un pot de peinture),
l'activité elle-même (ex : La peinture de la cuisine a pris 3 jours), le
résultat de cette activité (La peinture de la cuisine est affreuse), une
?uvre d'art (une peinture de Picasso), un type d'activité (la peinture en
bâtiment), ou encore un type de description non picturale qui rappelle
l'activité de peindre (la peinture des m?urs).
Ces différentes significations doivent bien sûr être distinguées, et on
pourrait les considérer comme autant d'entrées séparées dans un
dictionnaire. Mais cela ne suffit pas si l'on veut une description précise
des sens. Ainsi on s'accordera sans doute sur la nécessité de séparer les
types d'activité, suivant que ce sont des activités industrielles ou
artistiques (opposant ainsi la peinture impressionniste à la peinture en
bâtiment). Jusqu'où doit-on aller ? Doit-on aussi différencier la peinture
d'un immeuble de la peinture d'une voiture, qui utilise des procédés
radicalement différents ? Et où doit-on placer la peinture murale, qui se
situe à mi-chemin entre activité artistique et industrielle ? Que faire des
peintures sur le corps humain, qui vont du maquillage et du vernis à ongle
aux peintures rituelles de tout le corps pratiquées dans certaines
sociétés ?
Un autre type de distinction s'impose dans le cas où peinture signifie
'?uvre d'art'. On peut en effet parler de l'entité physique (Cette peinture
est toute petite) ou du contenu (Cette peinture est très expressive). Il
faut donc séparer aussi ces deux sens. Mais comment traiter alors les cas,
nombreux, où les deux aspects sont évoqués simultanément (Cette petite
peinture est un vrai chef d'?uvre) ? Doit-on différencier d'autres aspects,
comme par exemple l'entité « commerciale » (Cette peinture est très
chère) ?
On pourrait multiplier les exemples : il est clair que toute tentative
d'élaboration d'une liste précise et consensuelle des sens d'un mot se
heurte au fait que ces sens forment un continuum et non un ensemble
discret, et qu'il y a donc une part d'arbitraire dans la manière dont on
peut découper ce continuum. De plus, ce type de représentation occulte la
question essentielle que nous avons évoquée ci-dessus : si un mot comme
peinture devait être réduit à une telle liste de sens, l'usage de ce mot
entraînerait une charge cognitive insupportable pour les locuteurs qui
devraient, chaque fois que ce mot est employé, faire l'effort de découvrir
quel sens de la liste on doit lui attribuer. Cela ne fonctionne visiblement
pas comme cela. Le mot peinture possède un « potentiel sémantique » unique,
qui permet à tout locuteur de construire dynamiquement le sens approprié
dans un contexte donné sans avoir à parcourir mentalement la liste de ses
différentes significations comme s'il s'agissait d'un mot d'une langue
étrangère dont on rechercherait le sens pertinent en parcourant les
différentes définitions qu'en donne un dictionnaire.
C'est pour cette raison que l'on se tourne de plus en plus vers d'autres
modes de représentation d'une unité lexicale, mieux aptes à saisir le
potentiel sémantique qui lui permet de déployer ses diverses
significations. Au delà des divergences théoriques sur la conception du
sens[1], les chercheurs en traitement automatique des langues partagent un
objectif commun : obtenir des représentations qui permettent de calculer le
sens d'un mot dans un contexte donné par des mécanismes généraux, et si
possible « réalistes », c'est-à-dire compatibles avec ce que l'on sait
aujourd'hui du fonctionnement cognitif de la compréhension du langage.
Dans notre laboratoire, nous avons conçu dans cet esprit un modèle de la
polysémie (Victorri et Fuchs 1996), utilisant la théorie mathématique des
systèmes dynamiques pour modéliser la construction du sens d'un énoncé.
Dans ce modèle, on associe à toute unité polysémique un « espace
sémantique », et le sens de l'unité dans un énoncé donné est représenté par
une région de l'espace sémantique. C'est donc une approche continue du sens
qui évite les difficultés engendrées par les représentations discrètes. Espaces sémantiques Pour illustrer la notion d'espace sémantique, reprenons l'exemple de
peinture. Ses divers sens se distinguent par des valeurs différentes d'un
certain nombre de paramètres, que l'on peut considérer comme autant de
dimensions de l'espace que l'on va associer à ce mot. Ainsi on pourrait
construire un espace quadridimensionnel permettant de représenter les
variations des quatre paramètres suivants :
1. Un paramètre correspondant à la 'nature du référent', pouvant prendre
les valeurs 'matériau', 'activité' et 'résultat'. L'ordre dans lequel ces
valeurs seront disposées sur la dimension correspondante est important : Il
y a une plus grande proximité sémantique entre 'matériau' et 'activité'
d'une part, e