Euromap Technologies de la Langue
Promouvoir l'ingénierie linguistique en Europe

Success stories

 

COGEMA - A la quête du SPIRIT

Notre étude de cas illustre l'intégration réussie du moteur d'indexation et de recherche d'informations SPIRIT au sein du groupe industriel COGEMA et les avantages que peut apporter un tel outil linguistique. L'originalité de cette étude réside d'une part dans l'évolution du produit au fil des années chez COGEMA, et d'autre part dans la démarche de Cyrille de Turenne, de la Direction R&D de COGEMA, visant à démocratiser l'utilisation de SPIRIT au sein du groupe ainsi qu'à améliorer ses fonctionnalités notamment par la création du Club d'Utilisateurs de SPIRIT.

Historique (septembre 1993)

Le Groupe COGEMA est l'un des leaders mondiaux du cycle du combustible nucléaire. Ses domaines d'activité vont de la mine, la conversion et l'enrichissement de l'uranium, jusqu'au traitement et au recyclage du combustible usé. Il possède 18 300 salariés, un chiffre d'affaires de 5,95 milliards d'euros et est présent dans plus de 30 pays. Le Groupe COGEMA offre aux producteurs d'électricité du monde entier une large gamme de produits et de services.

La demande de la création d'une base de données et de connaissances émerge en mars 1993 de la branche combustible de COGEMA, dans le but de rassembler dans une même base les données internes - des documents sur les réacteurs nucléaires et les combustibles (caractéristiques, procédés de fabrication, utilisation, moyens de production) - et de les rendre disponibles à l'ensemble du groupe. La deuxième raison réside dans l'optique de la gestion et de la transmission des connaissances au sein du groupe, notamment pour les documents de référence (documents techniques, réglementaires et contractuels). La production de ce genre de documents s'élève de 5 000 à 10 000 pages par an.

Evaluation des outils (décembre 1993 à juin 1994)

Suite à cette demande, un cahier des charges est élaboré. Cyrille de Turenne, de la Direction R&D est alors chargé de mener cette mission. Dans un premier temps, cet ingénieur en chimie suit une courte formation en documentation et gestion de l'information, afin de mieux pouvoir comprendre et évaluer les logiciels de traitement du langage naturel. Par la suite, il étudie et teste les différents outils utilisés au sein du groupe et existant sur le marché.

Sélection et acquisition de SPIRIT (mars 1995)

Suite à une série de tests comparatifs, la solution d'indexation et de recherche d'information SPIRIT, conçu par Christian Fluhr du Commissariat à l'Energie Atomique (CEA) et édité par la société Technologies-GID (T-GID) obtient le meilleur score. SPIRIT s'avère être le plus apte à répondre aux besoins de COGEMA, sachant que "tout est fait pour faciliter à l'utilisateur la recherche de l'information."(Cyrille de Turenne).

SPIRIT a répondu aux critères de sélection suivants:

  • Possibilité d'importer et d'exporter les données sous forme ASCII
  • Gestion par document avec sa fiche bibliographique
  • Recherche en langage naturel
  • Classement des résultats par ordre de pertinence
  • Temps de réponse inférieur à 5 secondes
  • Gestion des accès
  • Système client-serveur descendants etc.

SPIRIT, un moteur d'indexation automatique et de recherche d'information

  • Indexation automatique

Chaque document destiné à être mis à la disposition des utilisateurs fait l'objet d'une indexation intégrale effectuée automatiquement par le module Collector de SPIRIT. Lors du processus d'indexation, SPIRIT procède à une analyse morphologique et syntaxique du texte, qui s'appuie pour le français sur un dictionnaire de 500 000 entrées incorporant les différentes formes fléchies d'un même mot. SPIRIT possède également un lexique d'expressions idiomatiques.

  • Recherche en langage naturel

La recherche dans les sources d'information indexées par SPIRIT se fait en utilisant un navigateur standard. L'utilisateur formule sa requête en langage naturel. Celle-ci fait l'objet d'une analyse linguistique identique à celle utilisée lors de la phase d'indexation.

A l'issue du travail d'analyse de la requête et d'élimination des mots non utiles, en fonction de critères grammaticaux ou morphologiques, SPIRIT procède à la normalisation ou lemmatisation des mots utiles.

SPIRIT permet d'élargir la recherche aux termes sémantiquement proches et aux équivalents. Il est fourni en standard avec plus de 130 000 règles.

  • Des réponses classées par ordre de pertinence

Après analyse de la requête, SPIRIT recherche dans la base les documents répondant le plus précisément à la demande formulée par l'utilisateur. Il lui présente la liste des textes trouvés en les classant par ordre décroissant de pertinence. Celle-ci est notamment déterminée par la ou les "dépendances linguistiques" entre les termes de la question et ceux trouvés dans les documents de la base.

  • Interrogation multilingue

SPIRIT est un moteur de recherche en texte intégral autorisant une interrogation multilingue et interlingue (français et anglais).

Intégration de SPIRIT à COGEMA (1995-2002)

En mars 1995, COGEMA fait l'acquisition de SPIRIT. Un contrat de sous-traitance est alors établi avec une société implantée dans les Ardennes pour la numérisation des documents destinés à la base des connaissances. La Direction R&D s'occupe activement de la promotion de l'outil ainsi que de la formation des utilisateurs. Il se charge de l'introduction des documents électroniques dans une base SPIRIT, de la numérisation des documents papier et de la création et l'administration des bases. En outre, ce département aide à la sélection des documents et des sous-ensembles.

Depuis son intégration à COGEMA, le logiciel SPIRIT a suivi une évolution et est passé de la version 1.3 en 1995 à 2.2 en 2002.

Le Club des Utilisateurs de SPIRIT

Créé en 1998 et présidé par Cyrille de Turenne, ce club est indépendant de l'éditeur de SPIRIT et a comme but d'identifier et de mettre en commun les problèmes rencontrés par les utilisateurs et de les présenter à l'éditeur pour l'amélioration des fonctionnalités et de la convivialité de l'outil linguistique.

Lors de réunions trimestrielles les 30 sociétés membres (parmi elles, des banques, des assurances, des centres de recherche, des ministères, etc.) se rencontrent pour discuter et travailler autour de différents thèmes relatifs à SPIRIT.

Résultats

"La fonctionnalité principale de SPIRIT est de mettre des documents en vrac dans une base de données et de trouver l'information pertinente en s'appuyant sur la performance du moteur de recherche"(Cyrille de Turenne).

Aujourd'hui, le nombre de bases est passé à COGEMA de 2 à 6, et le nombre de clients utilisateurs de 20 à 150. Parmi les utilisateurs, nous trouvons aussi bien des ingénieurs que des documentalistes.

Les bases comprennent 17 500 documents, soit 300 000 pages de textes et 80 000 000 de mots indexés sur 25 giga octets de mémoire disque. Ceci équivaut à 55 mètres linéaires de documents ou au contenu de 10 armoires.

Chaque mois, s'ajoutent 10 nouveaux clients utilisateurs. En outre, le nombre de requêtes des utilisateurs s'élève à 800 questions par mois.

  • Les difficultés rencontrées

L'une des difficultés rencontrées résidait dans l'alimentation des bases. Il fallait que chacun ait le réflexe d'entrer et d'archiver ses documents dans les bases SPIRIT. Par ailleurs, les utilisateurs de cet outil devait classer et thématiser ces documents. Ce qui représentait un effort d'autant plus grand que le nombre de documents à entrer dans les bases est important.

Il fallait également sensibiliser les employés du groupe à l'existence de SPIRIT, ainsi qu'à ses avantages.

  • Les solutions trouvées

Pour répondre au problème de l'alimentation des bases, le département R&D s'est chargé de la numérisation, de la classification et de l'introduction des documents à archiver sur demande.

Ce même département met à la disposition des employés de COGEMA un centre de documentation sur SPIRIT, organise des formations et publie régulièrement une revue sur l'outil linguistique.

A l'origine de l'utilisation de SPIRIT à COGEMA, Cyrille de Turenne de ce même département s'occupe activement de la promotion et du suivi de l'outil linguistique en formant les utilisateurs, élaborant des statistiques sur le nombre d'utilisateurs, de requêtes, etc. et publiant le semestriel SPIRIT On-line  présentant les fonctionnalités et évolutions du logiciel.

  • Le succès

Grâce à la démarche, aux efforts continus et au soutien du département de R&D, en particulier de Cyrille de Turenne, la technologie SPIRIT est intégrée au sein du groupe COGEMA depuis 7 ans et permet de tirer de nombreux bénéfices notamment de:

  • Surveiller et partager l'information
  • Trouver l'information pertinente
  • Gérer les connaissances
  • Profiter des savoir-faire existants
  • Ne pas répéter les mêmes erreurs
  • Améliorer les prises de décision
  • Et enfin gagner du temps

Cette enquête a été réalisée par ELDA grâce au témoignage de Cyrille de Turenne, COGEMA. Nous le remercions pour sa coopération.

 

Liens:

COGEMA

Technologies-GID

SPIRIT

 

Technologies-GID

http://www.t-gid.com

Editeur et distributeur de logiciel depuis 1983, le groupe Technologies réalise un chiffre d'affaires de 92 MF pour un effectif de 90 personnes. Il compte 2300 clients, parmi lesquels figurent plus de 70% de grands-comptes français.

Technologies-GID a été créé en 1993 lors du rachat par le groupe Technologies du logiciel SPIRIT.

Technologies-GID assure la commercialisation de SPIRIT, Système d'Accès à l'Information en langage naturel, et propose l'ensemble des prestations (formation, conseil, assistance) permettant une utilisation optimum du produit.

SPIRIT, fruit d'une expertise poussée dans le domaine de l'informatique et de la linguistique a nécessité plus de 120 années/homme en matière de recherche et développement en collaboration étroite avec les plus grands organismes de recherche (CEA, Ecole des Mines, Universités, etc.).

 

Autres références, des sites qui utilisent SPIRIT

  • Cour des Comptes
  • Bibliothèques du CEA (Commissariat à l'Energie Atomique)
  • Bibliothèque de l'IHEDN (Institut des Hautes Etudes de la Défense Nationale)
  • Premier Ministre
  • MINEFI (Ministère de l'Economie, des Finances, et de l'Industrie)
  • RTL
 

 

Citations de Cyrille de Turenne, R&D, COGEMA

Utiliser SPIRIT pour:

"Réutiliser l'expérience des autres"

"Améliorer la prise de décision pour ne pas faire les mêmes erreurs "

"Trouver l'information pertinente "