Les professionnels de l'information auront-ils une place dans les collaboratoires de la recherche ?

W.A. Turner

Direction CERESI-CNRS, Meudon.


Nous mettons ici en évidence la profonde évolution des modes de production, circulation des savoirs, qui se manifeste entre autres par le développement rapide de "collaboratoires de recherche", ainsi que les principales conséquences qui en résultent pour les professionnels de l'Information. Les capacités offertes par la "plasticité numérique" permettent, en effet, de gérer de manière efficace une quantité toujours plus grande de types d'information. L'apparition de "bibliothèques électroniques" sur les grands réseaux de la recherche, ainsi que l'élaboration sur ces réseaux d'interfaces et de modes de traitement des données numérisées de plus en plus performants posent, à n'en pas douter, des défis majeurs et passionnants pour les professionnels de l'Information.





          

Introduction

Quel est l'impact des nouvelles technologies de l'information et de la communication (NTIC) sur les modes de production des connaissances scientifiques d'une part, et sur les pratiques des professionnels de l'information d'autre part ? Formulée ainsi, cette question pourrait logiquement conduire à deux réponses différentes : l'une visant à évaluer la situation au niveau scientifique ; l'autre traitant de l'avenir de la profession. L'objectif de ce texte sera de considérer que ces deux orientations sont indissociables :


          

Les nouvelles structures sociales de la production de la science

Le vocable qui convient à la description de ces nouvelles structures est celui de collaboratoires de recherche [1]. L'émergence de ces collaboratoires coïncide avec l'emploi des réseaux informatiques pour la communication des informations scientifiques et techniques. L'importance des communications médiatisées par ordinateur est clairement reconnue en connexion avec la mise en place de la National Information Infrastructure. Dans le document servant à décrire les objectifs de l'administration Clinton, la notion de collaboratoire désigne les "centres de production scientifique et technique "sans murs" dans lesquels les chercheurs réalisent leurs recherches sans être limités par leur localisation géographique. Grâce aux réseaux [du type RENATER en France], ils peuvent tout à la fois interagir interactivement avec leurs collègues dans d'autres universités; accéder à des instruments à distance; partager leurs données et leurs ressources computationnelles et, enfin, accéder aux informations réunies dans les bibliothèques électroniques" [2].

Un exemple concret aidera peut-être à mieux comprendre les enjeux. Le fonctionnement d'un des collaboratoires de la recherche financé actuellement par la NSF est indiqué ci-après. Le collaboratoire en question travaille sur un vers nématode, le Caenorhabditis elegans, dans le but de caractériser son patrimoine génétique, son anatomie et son développement [3].

La communauté des chercheurs travaillant sur le C-elegans a commencé son activité vers la fin des années 1960 et comporte aujourd'hui environ 400 membres aux Etats-Unis. Ils appartiennent à des laboratoires géographiquement éloignés les uns des autres mais ils se connaissent et ont l'habitude d'échanger facilement des informations. La liste d'informations dont ils se servent peuvent être regroupés dans les catégories suivantes :

                         


1. les informations archivées

Dans cette catégorie, on trouve :
                         


2. les informations publiées

Cette catégorie inclue les informations suivantes :

                         


3. Les informations informelles

Cette troisième catégorie d'informations contient :
                         


4. Les données non-publiées

Cette catégorie d'information concernent les résultats intermédiaires qui sont localisés dans un laboratoire donné du réseau sous forme de texte (notes, descriptions méthodologiques, et listes de lignées); cartes du génome (dessins); micrographes (images).

A travers cet exemple, prend forme une nouvelle conception de l'accès aux informations scientifiques et techniques. Trois points doivent être soulignés:

Sur le plan technique, les outils existent pour intégrer les différentes catégories d'information citées ci-dessus dans une structure commune. Cette structuration respecte la spécificité de chaque type d'information. Le modèle employé est celui d'une banque de données orientées objets. Cette stratégie de représentation conduit à "capturer" tout élément d'information disponible dans le réseau moyennant son intégration dans un bloc informationnel qui deviendra un "objet" indépendant du système. Le collaboratoire est composé d'objets multimédia distribués géographiquement entre une grande variété de locations dans le réseau.

C'est dans ce contexte que le rôle du professionnel de l'information doit être posé.


          

L'impact des NTIC sur les pratiques professionnelles de l'information

Les professionnels de l'information ont traditionnellement joué le rôle de médiateurs, organisant pour leurs "clients" un accès aux informations pertinentes stockées dans les bibliothèques et, plus récemment dans les bases de données. Cependant, comme nous l'avons vu ci-dessus, les NTIC signifient que cette médiatisation sera de plus en plus réalisée à l'aide de l'ordinateur. La figure 1 $$$$$$ sera utile pour évaluer la nature de cette évolution vers un réseau hybride de gestion des informations scientifiques et techniques.

La figure 1 $$$$$$$ montre les fonctions traditionnelles de médiation qui ont caractérisé l'industrie de l'information jusqu'à une date récente. Cette figure a été construite par référence au cycle des valeurs ajoutées aux documents primaires sortant des laboratoires de recherche.

Les documents de laboratoires fournissent des informations sur les recherches en cours, mais celles-ci ne sont pas encore certifiées conformes aux normes scientifiques et techniques en vigueur. Le rôle joué par les maisons d'édition vis-à-vis des communautés scientifiques a été d'institutionnaliser l'évaluation par les pairs avant de publier des articles scientifiques et techniques. Cette évaluation est une première reconnaissance professionnelle, la confirmation que l'auteur d'un article a fait preuve d'originalité en appliquant une démarche scientifique rigoureuse. L'édition est le lieu d'une sélection : la pertinence des informations mise en circulation dans les journaux est validée. Une première fonction de médiation opérée par les professionnels de l'information est donc celle d'organiser les circuits d'édition d'une science certifiée.

Le nombre d'articles scientifiques et techniques publiés par jour dans le monde est estimé d'être de l'ordre de 5 000. Recenser cette production et l'organiser en vue des recherches documentaires ont conduit les documentalistes à mettre au point un catalogue impressionnant de normes pour l'intégration d'informations hétérogènes dans des espaces informationnels uniques. Ce travail de normalisation s'effectue à l'aide d'outils sophistiqués de catalogages et d'indexations. L'objectif est d'organiser le stockage d'informations répertoriées de manière à pouvoir les retrouver facilement. Les techniques électroniques de gestion des bases de données se sont beaucoup développées ces dernières années. Selon les études menées par l'Observatoire du Marché de l'Information de la Commission Européenne, il existe en Europe et aux Etats-Unis environ 525 serveurs qui commercialisent plus de 4 300 bases de données. Le volume d'information disponible est impressionnant. Plus de 260 millions notices bibliographiques existent, correspondant au signalement des publications disponibles depuis le début de l'informatisation des bases de données, vers la fin des années 1960.

La figure 1 $$$$$$$$ montre la place des documentalistes dans la chaîne de production des valeurs ajoutées au sein de l'industrie de l'information. Grâce à leur action de collecte et de normalisation des publications, ils organisent l'accès aux publications. Cette médiation s'opère grâce aux normes qui codifient les savoir-faire de la profession [5]. Ces normes contribuent à la mise en place des structures de représentation des contenus documentaires et de formats qui se veulent précises et universelles.

Quant aux serveurs, ils interviennent pour la commercialisation des bases de données électroniques, comme nous avons vu à l'instant. Leur action de médiation passe par la création des structures d'interface conviviales. Cependant, le point important est celui souligné par J. Michel : [6] : "les serveurs connaissent une baisse des coûts vertigineuse à la fois pour les unités centrales et les périphériques. En 1989, l'unité de puissance d'une machine coûtait 30 000 frs par mois, elle en coûte 12 000 en 1993. Même tendance pour les disques magnétiques, qui sont passés de 1 800 francs/mois/gigaoctet en 1991 à 730 francs en 1993. On peut stocker de plus en plus de bases de données (textes, images fac-similé). Les logiciels sont équipés de fonctions complexes, ils permettent la recherche simultanée dans différents programmes, la réalisation de statistiques on line, le classement automatique de références, etc". Ces observations permettent de comprendre une tendance soulignée par l'Observatoire du Marché de l'Information de la Commission Européenne : la création des bases de documents primaires domine désormais nettement sur la création des bases de données bibliographiques.

La figure 2 $$$$$ s'efforce de résumer les évolutions en cours. Comme nous l'avons expliqué ci-dessus, les laboratoires de recherche sont appelés à se regrouper au sein des collaboratoires. L'émergence de collaboratoires implique le besoin de gérer des flux d'informations électroniques en augmentation rapide. Un outil de gestion est le serveur. L'ouverture des réseaux de type RENATER s'accompagne de la mise en service de serveurs spécifiques du type WAIS, Gopher, World Wide Web. Ces serveurs permettent à des équipes individuelles d'ouvrir un accès par ces réseaux à leurs propres bibliothèques internes de données, de programmes et de publications. L'accès WAIS est par l'intermédiaire des techniques d'indexation documentaire; l'organisation Gopher conduit les équipes à situer leurs informations par rapport à la structure hiérarchique d'un plan de classement; World Wide Web met en oeuvre des technologies de navigation hypertextuelle. Nous sommes dans une phase d'organisation "spontanée" de l'offre des informations sur les réseaux : le souci des professionnels visant à la normalisation des clés d'accès employés dans ces différents systèmes n'a pas encore été ressenti.

Quant à la fonction éditoriale, une conception traditionnelle de cette activité n'est pas adéquate pour endiguer les flux : les Comités de Rédaction ne "contrôlent" qu'une quantité d'information en baisse constante par rapport à toutes les informations circulant dans les réseaux. Dans certaines disciplines telles que la physique par exemple, on parle déjà d'une culture du "pre-print". Ces pre-prints ne font pas l'objet d'une évaluation par les pairs; ils sont inscrits directement sur un tableau d'affichage des nouveautés. Une communauté scientifique peut suivre "en direct" la science en action sans devoir attendre les mois qui séparent la rédaction d'un article de sa publication dans un journal scientifique. Mais à quel prix? La qualité de la production scientifique peut souffrir des effets de mode et la pression de publier rapidement des résultats. Il suffit de citer les cas de la fusion froide et même de la supraconductivité à haute température pour s'en rendre compte [7].

L'importance des journaux dans le processus de certification des connaissances scientifiques a été soulignée ci-dessus. L'exemple de la physique ouvre toutefois une nouvelle perspective : celle d'une certification par le réseau. Dans un tel contexte, les journaux se verraient assigner le rôle de support pour la circulation d'une science "froide". La science "chaude", celle qui s'approche le plus de la découverte et qui suppose, de ce fait, une évolution des normes cognitives et méthodologiques en vigueur afin de s'en accommoder; bref, cette science-là se ferait en amont des journaux, les conflits d'interprétation et les négociations sur la science en devenir ayant lieu dans le réseau. L'impact sur la notion de "reconnaissance scientifique" est difficile à évaluer à l'heure actuelle.

Les grandes maisons d'édition suivent de près la situation :

Elsevier, par exemple, vient d'entreprendre une expérience aux Etats-Unis qui consiste à doter un nombre limité de campus américains avec la collection électronique de leurs journaux en science des matériaux. Ce projet, connu sous le nom de TULIP, a trois objectifs : étudier les conditions techniques de conception et de mise en service d'un serveur d'articles au sein des réseaux de la recherche; étudier les comportements des usagers mis en présence de cette "bibliothèque électronique"; réaliser, enfin, des études économiques et organisationnelles afin de parfaire leur projet industriel de diffusion électronique des journaux.

Springer Verlag a mis à la disposition de l'Université de Californie à San Francisco 40 de ses journaux en biologie moléculaire et radiologie. Les mêmes trois objectifs qui viennent d'être cités à propos du programme TULIP trouvent un écho dans le cadre de ce "Red Sage Project". L'originalité de ce dernier vient des objectifs de la bibliothèque qui pilote la mise en application du projet. Cette bibliothèque travaille activement avec Bell Laboratories sur la conception de la station de lecture pour la consultation des journaux électroniques. Elle étudie les conditions permettant d'établir une relation entre une recherche bibliographique sur MEDLINE et l'accès direct au texte intégral sur "Red Sage". Enfin, elle est consciente des enjeux économiques : étant donné que le prix de souscription des journaux augmente plus rapidement que l'inflation, la bibliothèque estime en accord avec Springer Verlag que le moment est venu d'expérimenter une communication médiatisée par ordinateur des informations.

Deux choses sont remarquables dans les projets présentés ci-dessus. La première est la prise de conscience de l'importance de l'édition électronique et les efforts explicites visant à en tenir compte dans une problématique d'extension des collaboratoires. Cette prise de conscience est générale : par exemple, la Commission des Communautés Européennes constate avec intérêt que la Foire aux Livres organisée chaque année à Francfort a eu une section spécifique consacrée aux produits d'édition électronique pour la première fois en 1992. Ce marché devrait atteindre 12,1 MEcus en l'année 2000 sur un marché global pour l'édition de l'ordre de 123,8 MEcus. Le domaine de l'information scientifique et technique représente un des secteurs le plus porteur de ce nouveau marché de l'édition électronique qui s'ouvre [8].

La deuxième remarque qu'inspirent les exemples ci-dessus est le rôle que jouent les professionnels de l'information dans l'organisation des expériences qui se mettent en place aux Etats-Unis. Aussi bien Elsevier que Springer Verlag se sont adressés à des Centres de Recherches en Sciences de l'Information pour réaliser le travail technique de mise en place des bibliothèques électroniques, les études économiques et celles de comportement.

On dit fréquemment en France que les éditeurs français sont timorés et tardent à s'engager dans la voie de l'édition électronique. C'est moins le cas pour les organismes de recherche. Nous assistons à l'heure actuelle au réveil aussi bien du CNRS [9] que de l'INSERM [10] à l'importance de l'impact des communications électroniques sur les modes de production des connaissances scientifiques. La faiblesse française se trouve plutôt au niveau de ses structures de recherche dans le secteur des sciences de l'information. D'une part, les sciences de l'information documentaire ne sont pas reconnues au niveau des Commissions du Comité National du CNRS ; et d'autre part, les Ecoles Doctorales ont davantage été envisagées comme un moyen de consolider des programmes d'enseignement universitaire que comme un moyen d'organiser des programmes de recherche. Le danger est là : l'expérimentation nécessaire pour comprendre le phénomène des collaboratoires suppose la réunion d'une équipe pluridisciplinaire composée de scientifiques, de professionnels de l'information et de concepteurs de systèmes techniques. Des telles équipes existent aux Etats-Unis. Qui prendra l'initiative de leur création en France?


          

Conclusions

Nous nous sommes proposés dans ce texte d'étudier les conditions d'un rapprochement entre le monde de la recherche et les professionnels de l'information. Ce rapprochement s'impose en vertu de l'émergence des collaboratoires. De plus en plus l'accès aux ressources informationnelles de la science sera médiatisé par l'ordinateur. A l'heure actuelle, les conditions de cet accès sont plutôt anarchiques. Et, pourtant, il convient de bien gérer des flux, car de l'efficacité de cette gestion dépend la qualité de la science à un moment donné.

Nous avons vu que les critères permettant aux professionnels de l'information d'évaluer la qualité de leur gestion des informations sont incertains. La relation qui existe entre la communication médiatisée par ordinateur d'une part, et la production sociale des connaissances scientifiques et techniques d'autre part, n'est pas suffisamment clair. Il semblerait que le processus social de certification des connaissances soit en train de changer, ce qui tend à modifier notre perception du rôle des journaux dans ce processus et pose une question encore largement ouverte : celle des techniques d'accès à la science en action.

Comment procéder? De toute évidence les problèmes posés nécessitent une démarche pluridisciplinaire réunissant les scientifiques, les professionnels de l'information et les concepteurs de systèmes techniques. Le danger dans le contexte actuel est que les structures de la recherche en sciences de l'information en France ne permettent pas de focaliser la démarche dont nous avons besoin.


          

Notes

[1]
W.A. Turner, Revues, indicateurs et collaboratoires : Introduction à la journée d'étude sur les revues scientifiques et techniques, MICIST-CNRS, mars 1993.

[2]
Presidential Task Force, The National Information Infrastructure : Agenda for Action, Washington September 1993.

[3]
Schatz B.R., "Building an Electronic Scientific Community", IEEE, 73-1129, 1991, pp. 739-748.

[4]
W.A. Turner, "Les réseaux hybrides d'intelligence", Cahiers du LERASS, No. 29, Mai 1993.

[5]
Un dossier complet sur la normalisation vient d'être publié dans le Bulletin des Bibliothèques de France, t. 38, no. 5, 1993.

[6]
J. Michel, Introduction à l'atelier 6 sur "l'utilisateur de l'information de demain : autonome ou assisté ?"; Information, Technologie, Innovation  : les Rencontres de l'Information Spécialisée, Ministère de l'Enseignement Supérieur et de la Recherche, Février, 1993.

[7]
G. Taubes, Publication by Electronic Mail Takes Physics by Storm, Science, Vol. 259, Feb. 26, 1993, pp. 1246-1248.

[8]
CCE-DGXII, New opportunities for publishers in the information services market : executive summary, Jan. 1993, Eur. 14925 EN, 28 p.

[9]
Voir le colloque MICIST sur L'avenir des revues scientifiques et l'émergence des collaboratoires, MICIST-CNRS, mars 1993.

[10]
INSERM, Workshop on the Present and Future of Electronic Communication in BioMedical Sciences, Alsace, France, Octobre, 1993.


© "Les sciences de l'information : bibliométrie, scientométrie, infométrie". In Solaris, nº 2, Presses Universitaires de Rennes, 1995