COGEMA
- A la quête du SPIRIT
Notre étude de cas
illustre l'intégration réussie du moteur d'indexation
et de recherche d'informations SPIRIT au sein du groupe
industriel COGEMA et les avantages que peut apporter un
tel outil linguistique. L'originalité de cette étude
réside d'une part dans l'évolution du produit
au fil des années chez COGEMA, et d'autre part dans
la démarche de Cyrille de Turenne, de la Direction
R&D de COGEMA, visant à démocratiser l'utilisation
de SPIRIT au sein du groupe ainsi qu'à améliorer
ses fonctionnalités notamment par la création
du Club d'Utilisateurs de SPIRIT.
Historique (septembre 1993)
Le
Groupe COGEMA est l'un des leaders mondiaux du cycle du
combustible nucléaire. Ses domaines d'activité
vont de la mine, la conversion et l'enrichissement de l'uranium,
jusqu'au traitement et au recyclage du combustible usé.
Il possède 18 300 salariés, un chiffre d'affaires
de 5,95 milliards d'euros et est présent dans plus
de 30 pays. Le Groupe COGEMA offre aux producteurs d'électricité
du monde entier une large gamme de produits et de services.
La demande de la création
d'une base de données et de connaissances émerge
en mars 1993 de la branche combustible de COGEMA, dans le
but de rassembler dans une même base les données
internes - des documents sur les réacteurs nucléaires
et les combustibles (caractéristiques, procédés
de fabrication, utilisation, moyens de production) - et
de les rendre disponibles à l'ensemble du groupe.
La deuxième raison réside dans l'optique de
la gestion et de la transmission des connaissances au sein
du groupe, notamment pour les documents de référence
(documents techniques, réglementaires et contractuels).
La production de ce genre de documents s'élève
de 5 000 à 10 000 pages par an.
Evaluation des outils (décembre
1993 à juin 1994)
Suite à cette demande,
un cahier des charges est élaboré. Cyrille
de Turenne, de la Direction R&D est alors chargé
de mener cette mission. Dans un premier temps, cet ingénieur
en chimie suit une courte formation en documentation et
gestion de l'information, afin de mieux pouvoir comprendre
et évaluer les logiciels de traitement du langage
naturel. Par la suite, il étudie et teste les différents
outils utilisés au sein du groupe et existant sur
le marché.
Sélection et acquisition de SPIRIT
(mars 1995)
Suite à une série
de tests comparatifs, la solution d'indexation et de recherche
d'information SPIRIT, conçu par Christian Fluhr
du Commissariat à l'Energie Atomique (CEA)
et édité par la société Technologies-GID
(T-GID) obtient le meilleur score. SPIRIT s'avère
être le plus apte à répondre aux besoins
de COGEMA, sachant que "tout est fait pour faciliter à
l'utilisateur la recherche de l'information."(Cyrille de
Turenne).
SPIRIT a répondu aux critères
de sélection suivants:
- Possibilité d'importer et d'exporter
les données sous forme ASCII
- Gestion par document avec sa fiche
bibliographique
- Recherche en langage naturel
- Classement des résultats par
ordre de pertinence
- Temps de réponse inférieur
à 5 secondes
- Gestion des accès
- Système client-serveur descendants
etc.
SPIRIT, un moteur d'indexation automatique
et de recherche d'information
Chaque document destiné
à être mis à la disposition des utilisateurs
fait l'objet d'une indexation intégrale effectuée
automatiquement par le module Collector de SPIRIT. Lors
du processus d'indexation, SPIRIT procède à
une analyse morphologique et syntaxique du texte, qui s'appuie
pour le français sur un dictionnaire de 500 000 entrées
incorporant les différentes formes fléchies
d'un même mot. SPIRIT possède également
un lexique d'expressions idiomatiques.
- Recherche en langage naturel
La recherche dans les sources
d'information indexées par SPIRIT se fait en utilisant
un navigateur standard. L'utilisateur formule sa requête
en langage naturel. Celle-ci fait l'objet d'une analyse
linguistique identique à celle utilisée lors
de la phase d'indexation.
A l'issue du travail d'analyse
de la requête et d'élimination des mots non
utiles, en fonction de critères grammaticaux ou morphologiques,
SPIRIT procède à la normalisation ou lemmatisation
des mots utiles.
SPIRIT permet d'élargir
la recherche aux termes sémantiquement proches et
aux équivalents. Il est fourni en standard avec plus
de 130 000 règles.
- Des réponses classées
par ordre de pertinence
Après analyse de
la requête, SPIRIT recherche dans la base les documents
répondant le plus précisément à
la demande formulée par l'utilisateur. Il lui présente
la liste des textes trouvés en les classant par ordre
décroissant de pertinence. Celle-ci est notamment
déterminée par la ou les "dépendances
linguistiques" entre les termes de la question et ceux trouvés
dans les documents de la base.
- Interrogation multilingue
SPIRIT est un moteur de
recherche en texte intégral autorisant une interrogation
multilingue et interlingue (français et anglais).
Intégration de SPIRIT à
COGEMA (1995-2002)
En mars 1995, COGEMA fait
l'acquisition de SPIRIT. Un contrat de sous-traitance est
alors établi avec une société implantée
dans les Ardennes pour la numérisation des documents
destinés à la base des connaissances. La Direction
R&D s'occupe activement de la promotion de l'outil ainsi
que de la formation des utilisateurs. Il se charge de l'introduction
des documents électroniques dans une base SPIRIT,
de la numérisation des documents papier et de la
création et l'administration des bases. En outre,
ce département aide à la sélection
des documents et des sous-ensembles.
Depuis son intégration
à COGEMA, le logiciel SPIRIT a suivi une évolution
et est passé de la version 1.3 en 1995 à 2.2
en 2002.
Le
Club des Utilisateurs de SPIRIT
Créé
en 1998 et présidé par Cyrille de Turenne,
ce club est indépendant de l'éditeur de SPIRIT
et a comme but d'identifier et de mettre en commun les problèmes
rencontrés par les utilisateurs et de les présenter
à l'éditeur pour l'amélioration des
fonctionnalités et de la convivialité de l'outil
linguistique.
Lors de réunions
trimestrielles les 30 sociétés membres (parmi
elles, des banques, des assurances, des centres de recherche,
des ministères, etc.) se rencontrent pour discuter
et travailler autour de différents thèmes
relatifs à SPIRIT.
Résultats
"La
fonctionnalité principale de SPIRIT est de mettre
des documents en vrac dans une base de données et
de trouver l'information pertinente en s'appuyant sur la
performance du moteur de recherche"(Cyrille de Turenne).
Aujourd'hui, le nombre de
bases est passé à COGEMA de 2 à 6,
et le nombre de clients utilisateurs de 20 à 150.
Parmi les utilisateurs, nous trouvons aussi bien des ingénieurs
que des documentalistes.
Les bases comprennent
17 500 documents, soit 300 000 pages de textes et 80 000
000 de mots indexés sur 25 giga octets de mémoire
disque. Ceci équivaut à 55 mètres linéaires
de documents ou au contenu de 10 armoires.
Chaque
mois, s'ajoutent 10 nouveaux clients utilisateurs. En outre,
le nombre de requêtes des utilisateurs s'élève
à 800 questions par mois.
- Les
difficultés rencontrées
L'une des difficultés
rencontrées résidait dans l'alimentation des
bases. Il fallait que chacun ait le réflexe d'entrer
et d'archiver ses documents dans les bases SPIRIT. Par ailleurs,
les utilisateurs de cet outil devait classer et thématiser
ces documents. Ce qui représentait un effort d'autant
plus grand que le nombre de documents à entrer dans
les bases est important.
Il
fallait également sensibiliser les employés
du groupe à l'existence de SPIRIT, ainsi qu'à
ses avantages.
Pour répondre au
problème de l'alimentation des bases, le département
R&D s'est chargé de la numérisation, de
la classification et de l'introduction des documents à
archiver sur demande.
Ce même département
met à la disposition des employés de COGEMA
un centre de documentation sur SPIRIT, organise des formations
et publie régulièrement une revue sur l'outil
linguistique.
A
l'origine de l'utilisation de SPIRIT à COGEMA, Cyrille
de Turenne de ce même département s'occupe
activement de la promotion et du suivi de l'outil linguistique
en formant les utilisateurs, élaborant des statistiques
sur le nombre d'utilisateurs, de requêtes, etc. et
publiant le semestriel SPIRIT On-line
présentant les fonctionnalités et évolutions
du logiciel.
Grâce à la
démarche, aux efforts continus et au soutien du département
de R&D, en particulier de Cyrille de Turenne, la technologie
SPIRIT est intégrée au sein du groupe COGEMA
depuis 7 ans et permet de tirer de nombreux bénéfices
notamment de:
- Surveiller et partager l'information
- Trouver l'information pertinente
- Gérer les connaissances
- Profiter des savoir-faire existants
- Ne pas répéter les mêmes
erreurs
- Améliorer les prises de décision
- Et enfin gagner du temps
Cette enquête a été
réalisée par ELDA grâce au témoignage
de Cyrille de Turenne, COGEMA. Nous le remercions pour sa
coopération. |