"Nouvelles mémoires" et nouvelle problématique d'accessibilité aux documents

Entretien avec Jean-Yves de LÉPINAY
Responsable du système documentaire à la Vidéothèque de Paris





                  
Quels ont été les principaux choix adoptés par la Vidéothèque de Paris ?

                  
J.Y.L. : Les choix documentaires qui ont été faits ne sont pas des choix documentaires habituels. La première contrainte fut de réunir un fonds d'images sur Paris. C'était l'idée de Pierre Emmanuel à la fois poétique et technique : constituer une mémoire audiovisuelle de la ville. A partir de ce concept, nous avons dû effectuer des choix. Nous avons fait le pari que toutes les images sont des "documents". Fictions, variétés, publicités, il y a une valeur documentaire dans toutes ces images ; et cette valeur sera augmentée de leur confrontation. Plus on va confronter des images de périodes et de genres différents, plus la valeur documentaire de chacune va augmenter. Nous avons donc choisi de les réunir sans faire de distinction, il n'y a qu'une seule base de données qui traite toutes les sortes d'images avec un seul champ de recherche. Ce qui pose notamment le problème du traitement d'un spot de publicité très court et d'un document de trois heures.

Deuxième choix : celui de créer un lieu public ouvert à tous. Donc nécessité d'une gestion documentaire pour un public non spécialisé. Le choix de départ est le Vidéotex, le Minitel, parce qu'il est connu d'un vaste public, mais aussi parce qu'il permet d'offrir notre catalogue sur le 36 14 ou le 36 15. Enfin parce qu'il nous permet d'offrir l'ensemble du processus de recherche et de consultation sur un écran unique.

Troisième choix : le langage libre, pour interroger le système comme on pense la question. Grâce à ce système, il est possible d'éviter tout intermédiaire du documentaliste ou autre. On recherche dans cette collection audiovisuelle comme on cherche dans les rayons d'une bibliothèque, en "accès libre".

Quatrième choix : la recherche sur le texte intégral, c'est-à-dire sur l'ensemble des mots de la fiche. Cela rend l'interrogation plus claire et permet une grande valorisation du fonds en incitant le public à voir des films qu'il ne connaît pas. Nous pouvons proposer beaucoup d' "entrées" pour un film donné,

                  
Qu'est-ce qu'une entrée ?

                  
J.Y.L. : C'est un mot par lequel un utilisateur pourra retrouver le fiche d'un film. Chaque terme de la fiche est une entrée, puisque l'on recherche en texte intégral. Dans le cas d'une indexation traditionnelle, on sort cinq termes qui sont très pointus et très exacts sur le film. Avec la recherche en texte intégral, on arrive à cinquante ou cent termes d'indexation sur un film et cela permet de répondre à des questions auxquelles le documentaliste n'aurait pas pensé à l'avance ; cela a aussi un effet de valorisation extrême du fonds. A n'importe quelle question que l'on pose au système, on a beaucoup de chances d'obtenir une réponse.

Mais il y une contrepartie : c'est un travail énorme de gestion du système documentaire. Par ailleurs, mais nous considérons cela comme un avantage, c'est un système bruyant.

                  
Qu'appelez-vous un système bruyant ?

                  
J.Y.L. : Si, en réponse à une question, certaines références ne sont pas proposées par le système, nous, documentalistes, disons qu'il y a du silence. A l'inverse, si des références non pertinentes apparaissent, nous disons qu'il y a du bruit.

Notre système en langage libre fait peu de silence et beaucoup de bruit, cela peut être un inconvénient. Mais nous estimons ce bruit souhaitable, car nous travaillons sur un fonds relativement limité de 4 000 références. C'est actuellement la plus grande collection individuelle à ce niveau d'accessibilité, mais c'est quand même peu par rapport à une bibliothèque. Donc nous pouvons nous permettre d'utiliser ce système un peu bruyant. Pour nous c'est un moyen de permettre l'exploration de ce fonds par le public. Aujourd'hui, plus de 97 % de films du fonds ont été demandés par le public.

Prenons un exemple : si on interroge par "Godard", on obtient 33 réponses c'est-à-dire tous les Godard : Jean-Luc évidemment, mais aussi un autre moins connu Bernard. Bien entendu en tapant Jean-Luc Godard, nous n'aurions pu n'obtenir que les références du cinéaste de la nouvelle vague ; et même les films qui ont été faits en référence à Godard comme un film de Léos Carax qui, dans son générique, dédie son film à Godard ; ou les émissions de télévision consacrées à Godard.

Autre exemple : les "ANNEES 20" (en chiffres ou en lettres, le système connaît toutes les manières de l'écrire) : on obtient aussi bien des films réalisés dans les ANNEES 20 que des films relatifs à cette période et des interviews contemporaines concernant cette période.

Au départ, nous avons pensé qu'il pourrait arriver que le public ne comprenne pas comment interroger ; nous avons donc inventé une sorte de thésaurus de "repêchage". Ce n'est pas un véritable thésaurus dans la mesure où l'indexation ne procède pas par termes classés dans une organisation hiérarchisée. Il s'agit plus exactement de rubriques différentes par genres de films, lieux, sujets. Ce n'est donc pas, pour parler en jargon documentaire, un outil d'indexation, mais un guide pour l'utilisateur. Mais aujourd'hui, notre expérience montre que le public utilise plus volontiers l'interrogation en langage libre que le "thésaurus".

                  
L'interrogation en langage libre serait donc la mieux adaptée à une utilisation par le grand public ?

                  
J.Y.L. : Certainement. Mais si elle est plus accessible au grand public, elle se heurte néanmoins à différents problèmes, le premier étant l'orthographe. Il était impossible d'inventer un système d'orthographe voisine tel qu'il en existe sur l'annuaire téléphonique : sur un tel nombre de références, avec des questions d'ordre si diverses, cela aurait été vite inutilisable. S'il est impossible de traiter tous les problèmes d'orthographe, nous apprenons néanmoins au système certaines des plus courantes : Gérard Philippe pour Gérard Philip, par exemple.

                  
Comment cette recherche en langage libre est-elle possible ?

                  
J.Y.L. : Elle s'appuie sur un ensemble de "dictionnaires" alimentés quotidiennement par les documentalistes. Il y a d'abord un dictionnaire de "mots vides", les prépositions, certains verbes... Même le mot film est un mot vide car il n'a pas en lui-même un contenu documentaire. Il y a aussi le dictionnaire des équivalences qui sont de deux types : les équivalences totalement réciproques et les équivalences réciproques qui introduisent une hiérarchie entre deux termes. Par exemple, le Café de la Paix n'est pas un bistrot, en revanche un bistrot de Montmartre est aussi un café : pour nous le mot café est plus large que le mot bistrot. Il y a enfin le dictionnaire des adjacences ; c'est un dictionnaire dans lequel figurent des expressions composées de deux ou plusieurs mots qui doivent être recherchés côte à côte.

Il faut insister sur le fait que ce système est original et pionnier en matière documentaire. Il a été conçu par Catherine Fournial et repose sur un travail important de l'équipe documentaire, qui en améliore les performances en même temps qu'elle rédige les fiches des nouveaux documents entrant dans le fonds. C'est donc un système ouvert aux évolutions du langage, à la prise en compte des habitudes du public, etc.


© "Pour une nouvelle économie du savoir". In Solaris, nº 1, Presses Universitaires de Rennes, 1994