Outil | |
Nom: | Analyseur morphologique (Xerox) |
Catégorie(s): | Produit/Logiciel, Outil. |
Type d'outil: | 2.3. Analyse morphologique |
Description: | Aspects linguistiques
Le transducteur lexical français fournit des informations sur la morphologie flexionnelle des mots isolés appelés les formes de surface. A chaque mot est associé au moins une chaîne - c'est la forme lexicale - qui comprend la forme de base, les informations relatives au genre, nombre, personne, temps etc. et la catégorie grammaticale (partie du discours).
Le transducteur propose plusieurs analyses lorsque la forme de surface présente une ambiguïté. Il peut également générer des formes de surface à partir de la chaîne lexicale correspondante (c'est-à-dire la séquence de la forme de base et les étiquettes morphologiques attachées au mot). Il permet également de reconnaître des séquences plus complexes comportant par exemple un clitique, une élision, une particule démonstrative, une séquence adverbiale ou un nom composé. La forme de base suit la convention standard utilisée en lexicographie française. Le lexique contient plus de 500 000 formes de surface.
Aspects informatiques
Les fichiers de source sont compilés en transducteurs à états finis. Il y a deux transducteurs :
- FrenchBig : où certains préfixes peuvent être ajoutés aux mots ;
- FrenchSmall : qui n'autorisent pas de préfixes productifs. |
Traitement: | Multilingue |
Langue(s) traitée(s): | |
Organisme: | Xerox Research Centre Europe |
|