Histoire des outils, systèmes, produits et usages d'informations dans l'élaboration des disciplines scientifiques : biomédecine et santé
Nicole PINHAS
INSERM - Réseau DIC-DOC - Centre du Kremlin Bicêtre - 80 rue du Général Leclerc - 94276 Le Kremlin-Bicêtre Cedex
pinhas@dicdoc.inserm.fr
Simone DAVID
INSERM Unité 88 - Santé publique et Epidémiologie Sociale et Economique
membre du Réseau DIC-DOC - U.88 INSERM - Hôpital National de Saint-Maurice - 14, rue du Val-d'Osne - 94415 Saint-Maurice Cedex
Avril 1996
Dans le domaine de la biomédecine et de la santé, maîtriser l'information a depuis toujours constitué un enjeu majeur.
Au fur et à mesure des avancées technologiques, des outils et des produits de plus en plus conviviaux et performants ont été développés pour essayer de dominer une masse croissante de données aux aspects tout à la fois pluridisciplinaires et spécialisés. Nous retracerons les grandes lignes de cette évolution et nous présenterons les nouvelles tendances (synthèses, méta-analyse ou travail collaboratif) que la mise en place des réseaux permet d'envisager. |
Un exercice consistant à décrire les produits issus de la gestion de l'Information Scientifique et Technique (IST) dans la sphère recherche biomédicale et recherche en santé aura comme préliminaire le constat de pluralité : pluralité des demandeurs dont les attentes sont variables selon leur fonction et leur spécialité (recherche fondamentale, clinique, gestion, formation, vulgarisation...), hétérogénéité du domaine qui fait souvent appel à un ensemble de concepts et de méthodes issus de nombreuses disciplines (épidémiologie, économie, sociologie, biologie, physique, chimie...), diversité de documents (articles, ouvrages, brevets, congrès, rapports publiés ou non, multimédia...).
Le concept de santé a évolué vers une approche globale définie comme un "état de complet bien-être physique, mental et social" qui conduit à prendre en compte de nombreux paramètres biologiques, psychologiques, sociaux, économiques. La biomédecine représente ainsi un domaine extrêmement éclaté qui fait appel à une grande variété de disciplines et met en jeu de multiples intervenants. Chaque discipline est organisée avec ses propres sociétés savantes, ses congrès, ses périodiques et ceci dans un contexte international. Pluridisciplinarité et interdisciplinarité sont de règle. Certains pensent que l'élargissement de l'éventail de la littérature biomédicale est dû à un accroissement de la spécialisation des chercheurs et d'autres affirment l'inverse. Nous ne prendrons pas parti et nous nous limiterons à constater que cette surinformation crée un obstacle et incite à faire des choix d'autant plus délicats qu'il n'existe pas toujours un consensus dans la communauté biomédicale.
Dans les domaines des sciences de la vie ou de la médecine, la diffusion des résultats est principalement axée sur la publication. Le processus d'écriture constitue avant tout une étape obligée dans le système existant d'évaluation de la recherche par les pairs, avec son rituel de soumission à des comités de lecture, d'acceptation avec ou sans modifications ou de rejet.
Les revues ont, de plus en plus, joué un rôle prépondérant qui ne se limite plus à leur fonction d'origine : la communication des résultats. La prise en compte des publications intervient, de manière officielle ou officieuse, comme un critère de sélection dans les choix économiques, politiques et stratégiques.
Ecriture et lecture se croisent, les commentaires venant s'adjoindre aux publications originales et offrant sous forme de lettres l'écho du débat scientifique, traces de phénomènes d'école, d'enjeux scientifiques...
Volume, profusion, richesse, dynamisme caractérisent l'IST : la redondance n'est pas absente.
L'information biomédicale, par ses implications, ne laisse pas indifférente la société qui, se sentant concernée, suit avec intérêt les innovations. La presse et les milieux associatifs interviennent dans la diffusion de résultats qui sortent rapidement des milieux restreints auxquels ils étaient initialement destinés. La nature des produits d'IST disponibles sera liée à cet intérêt spécifique, au champ biomédical et à l'impératif générique de valorisation des connaissances issues de la recherche.
Quels accès ? comment ? à quels coûts ? Ces questions constituent un axe descriptif des systèmes et produits qui permettra de décrire les usages possibles et réels adossés aux politiques d'IST.
Nous essaierons de repérer les grandes étapes de mise en place de produits et de cerner les changements en termes de rupture dans les pratiques aussi bien que dans l'offre.
Notre cheminement permettra de souligner l'interpénétration des usages et des outils, des systèmes et des produits et la nécessité pour les différents acteurs d'afficher des rôles et des compétences, des besoins et des offres et de ne pas ignorer les enjeux sociaux et économiques qui sous-tendent les choix et propositions.
Il est loin le temps où, le Dr Billings analysait le soir, chez lui après ses activités cliniques, les quelques 20 000 articles issus des 570 périodiques médicaux internationaux qu'il avait sélectionnés. Sur le modèle des catalogues d'ouvrages qui constituaient alors la principale source d'information, il créa l' Index Catalogue of the Library of the Surgeon General's office organisé alphabétiquement par sujets et noms d'auteurs. Ce répertoire devait donner naissance en 1879 à l'Index Medicus qui concernait 2300 des 4500 à 5000 périodiques existant à cette époque dans le domaine des sciences biomédicales.
Il s'agissait d'une initiative individuelle, basée sur le volontariat et le bénévolat. Le but de ce médecin militaire était de regrouper, en un seul outil, l'information disponible dans de nombreux index. Il conçut un système de classement original basé sur l'utilisation comme entrée de termes standardisés et la mise en place d'entrées croisées pour aider à localiser l'information nécessaire [KUNZ J. 1979].
Il faudra attendre l'ère de la conquête spatiale pour que les pouvoirs publics et politiques américains prennent conscience de l'importance stratégique que représente la maîtrise de l'information scientifique et décident la mise en oeuvre de programmes et l'attribution des moyens nécessaires.
C'est en 1957, en effet, que les russes lancent le premier satellite dans l'espace causant dans le monde scientifique ce que l'on a appelé "The sputnik shock". Cette "guerre technologique" entraînera un essor de la recherche scientifique et marquera la naissance des bases électroniques et des réseaux de communication.
En dix ans, on assiste à un doublement des crédits et du nombre
de chercheurs et de fait à une augmentation de la production
scientifique et de son corollaire l'article scientifique.
Le nombre de périodiques scientifiques ne cesse de croître
constituant une véritable"explosion de l'information" que
certains ont plus justement décrit comme une inondation : 100 en 1800,
1.000 en 1850, 10.000 en 1900, 100.000 en 1950...
Face à cette situation, l'utilisateur est impuissant et mal armé pour arriver à dominer cette masse de documents qui croît et s'accumule. Le chercheur travaille avec des livres de bases, quelques collections de revues et des fichiers engorgés par une masse de fiches classées dans une boîte. Il utilise des bulletins signalétiques ou analytiques produits électroniquement pour suivre l'actualité scientifique.
Les classifications et index deviennent inutilisables ; il faut envisager de nouvelles structures de langage, et normaliser la terminologie. En 1960, le MESH qui allait servir de modèle pour l'organisation et le classement du vocabulaire biomédical est créé : c'est alors un thésaurus hiérarchisé de 8000 termes, qui en comporte plus de 16000 actuellement.
Mais ces moyens conventionnels sont jugés inefficaces, et on évoque leur caractère rudimentaire comme entravant l'essor scientifique.
Néanmoins, de plus en plus soucieux et conscient de l'importance de l'information, on souhaite la maîtriser mais sans y consacrer plus de temps qu'auparavant. Pour participer à la "compétition scientifique", il devient vital de se tenir au courant des nouvelles parutions tant scientifiques que techniques : la recherche médicale et biologique ne peut progresser que par l'acquisition et la manipulation de nombreuses données.
Dans l'Expansion de la Recherche Scientifique de septembre 1963, on parle d'une crise de la documentation scientifique "elle est plus que sérieuse, elle a des aspects dramatiques... elle est en passe de devenir un des goulots d'étranglement de l'enseignement scientifique et de la recherche".
On commence donc à prendre conscience de l'enjeu économique et politique que la documentation scientifique peut représenter et la solution parait résider dans l'intégration des nouvelles techniques et des nouveaux outils qui commencent à se développer.
On pense résoudre tous les problèmes documentaires grâce aux nouvelles possibilités offertes par l'ordinateur ; et on place des espoirs inconsidérés dans ce nouveau moyen de communication qu'est l'informatique : c'est l'ère de "LA MACHINE éLECTRONIQUE".
En 1963, le Ministère de la Défense lance aux États-Unis les premières expériences de recherche d'information en ligne avec le projet Mac du Massachussetts Institute of Technology et le projet ORBIT (On line Retrieval of Bibliographic Information Timeshared).
Entre 1965 et 1968, d'autres systèmes sont mis au point : Dialog par la société Lockheed, RECON par la NASA.
La National Library of Medicine réalise une base pilote d'abord en neurologie puis sur 100 périodiques en langue anglaise (Abridged Index Medicus). MEDLARS (MEDical Litterature Analysis and Retrieval System) est opérationnel en 1964, réservé à un usage local, avec traitement par lots des recherches : chaque année 250 000 articles sont indexés à partir de 2500 périodiques.
On constitue les premières grandes banques de données : fichiers automatisés qui permettent d'accéder à des fonds documentaires importants. La naissance de MEDLARS, Biological Abstracts, Chemical Abstracts, Excerpta Medica et SCI (Science Citation Index) et quelques années plus tard de PASCAL suivait de près le développement de la technologie des ordinateurs.
L'information internationale publiée dans des milliers de périodiques est collectée et analysée en un système unique et homogène : les auteurs, le titre et la référence de l'article sont enregistrés pour permettre de localiser le document et divers systèmes (descripteurs, codes de classification..) sont utilisés pour exprimer le contenu scientifique du document. Il faudra attendre 1975 pour que les résumés d'auteur soient intégrés dans MEDLINE et viennent enrichir la recherche en langage libre. En France se met en place CANCERNET, base spécialisée en cancérologie et développée à l'Institut Gustave Roussy. Elle repose sur un réseau de collaborations européennes et d'analyses de documents réalisées par des chercheurs du domaine. Le langage utilisé, SABIR, est un thésaurus qui prend en compte l'environnement sémantique de chaque concept. Ce système n'a pas survécu aux rigueurs budgétaires et a été repris par le CNRS [Wolff-Terroine M. 1980].
Cependant, ces bases bibliographiques ne sont grossièrement que des analogues électroniques des index papier, mais grâce aux possibilités offertes par l'informatique elles deviennent des outils de recherche puissants utilisant la logique booléenne et rendant ainsi possible la combinaison de concepts normalisés.
Il est assez impressionnant de constater qu'aujourd'hui encore ces bases bibliographiques, dans leur conception d'origine, représentent les outils les plus utilisés, incontournables pour la recherche d'information.
La mise en place de ces systèmes, s'appuyant sur des moyens performants, permet de traiter d'importants volumes et d'accéder rapidement et facilement aux données sans toutefois changer la gestion de la chaîne d'information.
A partir de ce moment, il devient possible, à partir d'un terminal et par un système d'appel téléphonique, de dialoguer avec l'ordinateur central, quelle que soit la distance (interrogation en mode conversationnel et non plus en différé). La question est posée au système en direct, modifiée immédiatement en fonction de la réponse et les références correspondantes éditées instantanément. Les données mémorisées en ordinateur peuvent transiter sur les réseaux téléphoniques.
La National Library of Medicine (NLM) a joué un rôle moteur dans la diffusion de l'information biomédicale, facilitant l'accès à ses bases par la mise en place d'un réseau national et international de collecte et d'interrogation. En 1971, il y avait en tout 26 centres MEDLARS dont 14 aux États-Unis. Ces centres assuraient les fonctions décentralisées d'indexation, de formulation des questions, de formation des utilisateurs et de traitement des données sur ordinateur. Ils avaient la charge de mettre en place un réseau national. Des échanges réguliers entre les différents partenaires permettaient de faire évoluer bases et vocabulaire.
Dès 1972 on interroge en direct depuis Paris, grâce à la liaison transatlantique TYMNET, l'ordinateur de la NLM situé à Bethesda aux États-Unis [ZERAFFA J. 1975].
Le développement de nouvelles techniques de transmission de données sur réseaux et l'ouverture en 1977 de TRANSPAC, réseau public français de transmission de données par paquets, va abaisser les coûts, faciliter l'extension des interrogations de bases bibliographiques dans des centres de documentation spécialisés et ouvrir la voie à une commercialisation de ces services.
On explore les différentes possibilités offertes par l'outil informatique, et on vit une intense période de recherche pendant laquelle de nombreux projets pilotes prennent naissance concernant l'aide au diagnostic, la formation assistée par ordinateur et la réalisation de bases factuelles...
Si les systèmes bibliographiques disponibles permettent désormais de repérer de façon rapide, fiable et facile l'information, l'accès au document papier reste long et fastidieux. Signalement et accès au contenu sont dissociés. Pour cette raison, dans des domaines d'urgence comme la toxicologie, se mettent en place des bases de connaissances qui permettent d'obtenir directement les données recherchées et non plus uniquement "l'adresse" sans avoir recours au document d'origine. Un exemple est donné par la base RTECS, version en ligne du Registry of Toxic Effects of Chemical Substances. Toutes les données peuvent être critères d'interrogation: on peut ainsi savoir quels sont les produits qui provoquent tel symptôme chez l'homme ou quelle est la dose létale du parathion pour telle espèce.
En France, des bases en enzymologie et en toxicologie sont à l'étude et les centres anti-poisons participent à la constitution d'une base factuelle où sont consignées les données recueillies lors des appels (informations sur le demandeur, le toxique, la symptomatologie et les traitements...) [GERDAY R. 1972].
Dès 1971, DUCROT H. réalise une banque d'informations factuelles sur les médicaments à l'usage des cliniciens, la BIAM (Banque d'Informations Automatisées sur les Médicaments). Elle comporte un double fichier celui des principes actifs (3.000) et celui des spécialités (8.500). Pour chaque substance, les effets, les indications, les données toxicologiques, les doses et les noms étrangers ainsi que les interactions connues sont répertoriées.
Ces bases présentent l'état actuel des connaissances dans le domaine. Les données sont analysées et validées par des experts du domaine et la source n'est indiquée qu'à titre de contrôle.
Malgré les progrès réalisés en matière d'organisation et de diffusion de l'information, les résultats obtenus ne semblent pas à la hauteur de l'attente et des espoirs des demandeurs : le bilan est mitigé et on parle de déception et d'échec.
L'interrogation reste difficile et chère. L'utilisateur final se trouve dérouté par la rigidité et la complexité des systèmes existants dont l'usage est réservé aux professionnels de la documentation formés à ces outils qui obligent à apprendre et posséder un langage artificiel propre à chaque logiciel et à chaque système.
"L'informatique a suscité une grande espérance, espérance diffuse, mal motivée, entretenue par le goût du nouveau, par l'ignorance, par les constructeurs, parfois incompétents, souvent arrogants et toujours intéressés" [Grémy F. 1973].
En France, il faut insister sur le retard pris en matière d'IST dû principalement à un manque de coordination, au niveau national, des efforts et des moyens et à la non-existence d'une politique de formation.
C'est le réveil français : on va essayer de planifier et d'établir une politique nationale en matière d'Information Scientifique et Technique.
La même année, le centre serveur QUESTEL est ouvert, offrant aux utilisateurs français un accès aux bases Pascal, Francis, Cancernet, Chemical Abstracts et Darc...
La volonté des pouvoirs publics de développer une politique de formation et de sensibilisation auprès de l'utilisateur final conduisit, en 1983, à la mise en place des URFIST (Unités Régionales de Formation pour IST) à Paris et en province.
Les outils mis en place s'adressent principalement au monde de la recherche, publique ou privée (laboratoires pharmaceutiques, unités de recherche, laboratoires hospitalo-universitaires...) et restent réservés à des professionnels formés à ces techniques. Les documentalistes servent d'intermédiaires entre les bases et l'utilisateur final ; elles traduisent le langage scientifique en un langage artificiel propre aux systèmes. Le monde de la Santé dans sa globalité demeure fermé à ces outils, majoritairement en langue anglaise ; il les ignore ou les juge trop sophistiqués.
On allait assister à une diversification des utilisateurs, des services et des produits, à une familiarisation avec l'information pour tout un chacun et à une démystification d'une appréhension naturelle envers l'informatique.
Cette grande réussite technologique va bouleverser, au niveau national, le monde de l'information.
Jusqu'à présent les produits disponibles sur le marché de l'information s'adressaient aux chercheurs et aux hospitalo-universitaires, le plus souvent par l'intermédiaire d'une documentaliste. De nouveaux services et produits vont être réalisés pour toutes les composantes du milieu "santé": médecins généralistes ou spécialistes, pharmaciens, professions paramédicales....
Dans le domaine "Santé", plus de 145 bases et 70 services télématiques sont répertoriés dans "le répertoire des banques de données et des services télématiques en santé" (CREDES 1993).
Les services sont variés : aide à la pratique médicale, références bibliographiques, annuaires professionnels, catalogues de bibliothèques, informations pratiques ou recueil des données dans le cadre des réseaux de surveillance...
On met l'accent sur la convivialité des systèmes qui par l'existence d'interface et par une série de menus vont guider l'utilisateur dans sa démarche et lui offrir une assistance permanente en ligne à l'aide de touches de fonction spécifiques.
Des outils, jusqu'alors réservés aux professionnels de l'information, s'ouvrent ainsi à un nouveau type de demandeur : l'utilisateur final et touche désormais le grand-public. Communication et information commencent à s'imbriquer, et l'information devient un moyen de promotion.
A tout moment, sans contraintes horaires ou géographiques, il devient possible d'interroger depuis son domicile ou son lieu de travail, et non plus uniquement dans des lieux spécialisés : c'est la fin du monopole des centres de documentation comme lieu de repérage de l'information.
On assiste à un nouveau désenclavage de l'accès à l'IST avec suppression des intermédiaires.
Les bases existantes sont adaptées au système vidéotex comme MEDLINE et PASCAL et des fonds documentaires informatisés réservés jusqu'àlors à un usage interne et restreint sont mis à disposition de la communauté MINITEL.
On assiste à la prolifération de services thématiques qui ne sont plus le fait unique des grands organismes nationaux mais d'organismes professionnels plus ou moins importants (services hospitaliers, laboratoires pharmaceutiques, laboratoires universitaires...) : c'est l'explosion de la télématique en France.
Nous présenterons deux exemples d'utilisation du minitel spécifique au domaine biomédical :
L'offre d'un matériel simple, à la portée de tous et gratuit, a permis de révéler les attentes des utilisateurs qui, libérés de la tutelle des intermédiaires, vont s'affranchir dans l'usage des systèmes.
Chaque jour, de nouveaux services naissent plus ou moins riches et performants, et d'autres disparaissent. On connaît une explosion à l'échelle nationale qui s'apparente à la situation qui se développe à l'heure actuelle sur INTERNET à l'échelle mondiale.
Promotion et publicité se mêlent souvent à la notion d'information.
Des produits de plus en plus commerciaux sont disponibles, et on parle de plus en plus de "MARCHÉ DE L'INFORMATION".
Mais le coût et la lenteur des réponses représentent vite un frein à l'utilisation régulière du minitel dans la démarche informationnelle : de nombreux organismes et hôpitaux en interdisent l'accès. Il représente souvent un outil de dépannage à utilisation personnelle, simple et épisodique plus utile au praticien qu'au chercheur. Il permet d'élargir le public concerné aux non-professionnels et de valoriser des informations administratives et non plus uniquement scientifiques, phénomène que l'on retrouve actuellement sur les serveurs WWW d'INTERNET.
Le minitel a sensibilisé l'utilisateur aux outils en le familiarisant aux bases de données. En lui faisant connaître et apprécier l'usage de produits documentaires, il a créé un besoin et fait naître l'envie d'y accéder par des moyens plus rapides et moins coûteux. L'arrivée de la micro-informatique allait répondre à ces attentes.
Le développement de la micro-informatique dans les années 1985 va profondément bouleverser les habitudes de travail du monde scientifique et médical comme de la documentation.
Le micro-ordinateur devient un outil intégré à la pratique, les informations à recueillir sont de nature de plus en plus diverse (données cliniques du patient, dossier du malade, informations administratives et financières...).
On assiste à une nouvelle vogue technologique avec organisation et gestion informatisée de l'information.
Des produits sur support disquettes remplacent ou s'ajoutent à l'offre papier comme les Current Contents en 1988. Pour interroger les bases en ligne, le micro-ordinateur remplace le terminal et permet de transférer et stocker les références localement sur le disque dur, rendant possible la création de bases de données locales et thématiques. La mise en place d'une chaîne intégrée d'IST de la lecture à l'écriture et la gestion personnelle de l'information deviennent possibles : les logiciels documentaires envahissent le marché, plus ou moins sophistiqués selon la cible visé, documentalistes ou utilisateur final.
Cette tendance va s'accentuer avec l'apparition dans les années 1989-1990 des CD-Rom (Compact Disk Read Only Memory) à forte capacité de stockage. Ils permettent de plus, par l'existence d'interface conviviale, un accès facilité aux bases de données accessibles en ligne auparavant et, par une formule d'abonnement annuel, une maîtrise des coûts d'interrogation.
Toutes les bases accessibles en ligne sur les serveurs vont devenir disponibles sur CD-Rom et parfois pour une même base sous plusieurs versions qui diffèrent en fonction de l'éditeur de CD-Rom et de l'interface d'interrogation.
A côté de ces produits qui ne représentent qu'une adaptation conviviale des systèmes en ligne, enrichie d'outils de repérage et de dictionnaires, des produits thématiques se développent.
Par exemple, le CD-Rom Aids compactlibrary offre, sur le sida, une compilation de plusieurs sources, disponibles auparavant isolément. Il comprend à la fois des bases bibliographiques comme AIDSline de la National Library of Medicine et AIDS Database du Bureau of Hygiene and Tropical Diseases, des bases factuelles comme AIDStrials et AIDSdrugs décrivant les nouveaux essais thérapeutiques et les médicaments concernés, le texte intégral d'articles de périodiques importants traitant du sida et le texte intégral de deux NEWLETTERS. A partir d'un seul outil, l'utilisateur dispose d'une bibliothèque thématique électronique complète.
Dans le domaine de la prévention des risques professionnels, le CD-Rom CCINFO du Centre Canadien d'Hygiène et de Sécurité du Travail propose un regroupement des bases factuelles et bibliographiques de plusieurs organismes américains, canadiens et français.
En génétique, le CD-Rom GID (Génome Interactive Databases), version électronique du répertoire Genatlas de Frezal J., regroupe un ensemble de bases factuelles et bibliographiques touchant à la cartographie du génome humain.
La mise à disposition d'information sur le support CD-Rom dans la majorité des bibliothèques universitaires et médicales va entraîner des changements dans les habitudes documentaires des utilisateurs traditionnels des services en ligne. Chercheurs, étudiants, médecins, libérés du facteur coût, vont utiliser davantage les bases de données grâce à la facilité d'interrogation des outils, et même au côté ludique de la recherche qui entraîne chez l'utilisateur un sentiment de satisfaction incroyable [TENOPIR C. 1992]. La formule "abonnement" et la nécessité d'envisager un investissement en matériels non négligeable, vont entraîner une volonté d'organiser localement et collectivement la documentation. On va essayer de se regrouper par laboratoire, par service ou par site pour mettre en commun un poste informatique équipé d'un ou plusieurs lecteurs permettant d'interroger, le plus souvent, la base Medline et les Current Contents sur disquettes.
D'individuel avec le minitel, on passe à un usage collectif des outils d'information. Et on met en place des chaînes complètes informatisées de gestion et de traitement de l'information, de la bibliographie à la rédaction de l'article. L'inconvénient majeur à l'utilisation des CD-Rom reste le retard dans la mise à jour des données, en dehors de la manipulation fastidieuse des disques pour les utilisations non en réseau.
Face à une offre éclatée et à la multiplication des supports, il est devenu opportun que des communautés scientifiques organisent en fonction de leurs besoins des systèmes d'information intégrés et fassent évoluer les outils nécessaires. De la perspective client passif, on est maintenant dans une phase d'élaboration collective de filières d'information. Parallèlement surgit la possibilité d'une forme électronique d'écriture dans le contexte permanent d'accès aux réseaux.
Le besoin exprimé porte sur une information validée et synthétique, datée et qui sera mise à jour par des processus explicités. La mise à jour concerne également l'intégration de nouvelles informations dans des systèmes qui, grâce aux liens hypertexte, permettent d'appeler en temps utile une information spécifique.
Il s'agit de proposer des réponses aux besoins de recherche pluridisciplinaire et concertée, d'aide à la décision et de valorisation des connaissances disponibles.
Trois faits marquants semblent devoir être regardés de façon plus approfondie :
Jusqu'à présent la chaîne de la publication est contrôlée par les éditeurs.
Les publications sous forme électronique présentent plusieurs avantages : elles sont moins coûteuses et plus rapides à produire que la forme papier sans compter l'économie de place : un seul CD-Rom contient cinq années du Journal of the American Medical Association qui occupe pour la même période deux mètres de rayonnage [BELBENOIT-AVICH P.M. 1992].
Environ 68% des bases offrant du texte intégral concerne des périodiques qui peuvent exister sur plusieurs supports électroniques : en ligne sur serveurs commerciaux, sur disquettes, sur CD-ROM et sur réseaux.
Le serveur Dialog propose plus de 3000 sources en texte intégral avec un fichier MEDTEXT qui permet de retrouver les périodiques médicaux (dix périodiques spécialisés de l'American Medical Association, JAMA et le New England Journal of Medicine).
C'est en 1984 que le serveur BRS a créé CCML (Comprehensive Core Medical Library) qui offrait en ligne une bibliothèque d'une centaine de sources : périodiques médicaux et scientifiques, textbooks... On pouvait l'interroger comme un fichier mais aussi imprimer une partie ou l'intégralité de l'article repéré en interrogeant les bases bibliographiques traditionnelles comme MEDLINE et EMBASE. Cette possibilité se retrouve sur les CD-Rom OVID où le New England Journal of Medicine, disponible avec tableaux, figures peut être lié aux bases bibliographiques pour visualiser le document sélectionné.
Environ 37% des CD-Rom proposent du texte intégral et plus de 330 périodiques sont ainsi disponibles [TENOPIR C. 1993].
Les éditeurs Springer Verlag avec le projet Red Sage et Elsevier avec le projet TULIP ont lancé des projets expérimentaux de fourniture de leurs périodiques sous forme électronique dans des universités américaines.
Si presque tous les périodiques électroniques possèdent actuellement une version papier, cela ne sera bientôt plus vrai, car sur les réseaux commencent à apparaître des périodiques disponibles uniquement sous forme électronique comme The Online Journal of Current Clinical Trials : il s'agit du premier périodique biomédical accessible sur INTERNET, avec comité de lecture, édité par l'American Association for the Advancement of Science et implanté sur l'ordinateur de l'OCLC depuis 1992. Il possède une interface conviviale et permet un lien entre les références citées dans l'article et la base Medline pour visualiser plus d'informations (résumé et descripteurs) (KEYHANI A. 1993). Plusieurs revues en texte intégral sont actuellement disponibles sur le serveur WWW de l'OCLC (http://www.oclc.org) comme Immunology Today, Current Opinions in Medicine and Current Opinions in Biology, The Online Journal of Knowledge Synthesis for Nursing. Mais la plupart des revues comme le British Medical Journal (http://www.bmj.com/bmj/index.html) ne mettent à disposition sur l'Internet que les sommaires, avec pour chaque article le résumé d'auteurs et pour certains sélectionnés le texte intégral.
A côté, des dizaines de lettres sont créées par les chercheurs ou les centres de documentation sur INTERNET.
Ces bases permettent d'accéder directement à l'information recherchée.
"Pour le médecin qui n'a pas un accès facile à une bibliothèque médicale importante, l'accès immédiat à une source plein-texte est un avantage évident"
Les périodiques électroniques sont le plus souvent encore utilisés pour localiser des articles intéressants (comme les bases bibliographiques), pour trouver une donnée particulière (comme une base factuelle) ou pour lire un article repéré autrement ; jusqu'à présent ils ne se substituent que rarement aux formes papier. Mais, l'augmentation des capacités de stockage et de la vitesse de recherche des ordinateurs, les nouvelles technologies des réseaux et l'amélioration de la qualité des images avec des possibilités de zoom participent au développement de tels produits et à leur intégration par l'utilisateur dans sa chaîne de travail informationnelle.
En 1980, apparaissent les premiers grands réseaux destinés aux centres de recherche tels que BITNET.
Quelques années plus tard est créé INTERNET pour permettre de relier les différents réseaux existants (JANET en Grande Bretagne, EARN...) en adoptant le protocole de communication TCP/IP (Transmission Control Protocol/Internet Protocol).
En France, se met en place en 1990 RENATER, interconnexion de réseaux locaux et régionaux. Subventionné en grande partie par les conseils généraux et les organismes publics, le câblage permet aux laboratoires d'accéder à l'offre INTERNET ; et le chercheur a l'impression de disposer de services gratuits sans contraintes de temps et de distances.
Les outils disponibles deviennent de plus en plus conviviaux et performants. Ils fonctionnent selon le mode client/serveur avec nécessité de logiciels spécifiques qu'il est possible de récupérer sur le réseau.
Avec la mise à disposition de serveurs WWW (World Wide Web), on assiste à une multiplication des offres hypermédia : on peut accéder à n'importe quel type de document électronique (texte, image fixe ou animée, son...) Par un simple "clic " sur la souris de son micro-ordinateur, on va naviguer d'information en information, d'un serveur à un autre à travers ce chaînage organisé.
Plusieurs services sont disponibles :
Nous présenterons trois exemples de communautés scientifiques qui se sont organisées à travers les réseaux.
Un réseau de coopération internationale est mis en place pour coordonner et orienter le partage des matériels et de l'information. Ce projet génère une masse énorme d'informations qu'il faut gérer et de fait, implique une collaboration entre biologistes et informaticiens.
Sur les séquences, les données recueillies dans diverses bases internationales sont régulièrement échangées : la base GenBank d'origine américaine produite par le NCBI, EMBL produite par l'European Molecular Biology Laboratory d'Heidelberg et DDBJ produite par le National Institute of Genetics du Japon collectent séparément l'information et se transmettent chaque jour les nouvelles données répertoriées. Au niveau local, la multiplication et l'automatisation des données produites conduit à envisager des techniques d'analyse, de gestion, de stockage et d'archivage qui permettent de garder en mémoire informatique le suivi des expériences avec possibilité d'un retour à l'historique et aux commentaires : on parle de cahiers de laboratoires informatisés [JORDAN B. 1993]. Les résultats sont mis à la disposition de la communauté scientifique selon des modalités précises d'écriture, de validation, d'analyse et d'archivage qui impliquent la définition de normes, de règles d'écriture communes pour pouvoir comparer les résultats, les stocker en constituant des bibliothèques de données et les analyser à un niveau mondial.
Ce projet a conduit à la gestion des données de laboratoire, à la mise au point d'outils d'analyse et à la création de bases de données relationnelles spécifiques liant les données brutes aux références bibliographiques correspondantes.
La GDB (Genome Data Base) du Johns Hopkins University regroupe tout ce qui concerne le génome sauf les séquences d'ADN, des données de cartographie, aux renseignements sur les sondes et aux répertoires d'adresses et présente un lien avec l'atlas des maladies génétiques l'OMIM, version électronique de l'ouvrage Mendelian Inheritance in man créé sous forme papier en 1960 par V.A. MCKUSICK. On peut entrer dans la base en spécifiant une région chromosomique et demander quels sont les gènes connus ou aller dans OMIM pour demander si des maladies génétiques y sont localisées ou obtenir le nom des sondes et l'adresse de leur détenteur [SCHORDERET D.F. 1991]. Quel que soit le support, réseaux ou CD-Rom, des systèmes liant les bases bibliographiques aux bases factuelles sont organisés : les données des bases de séquences, GenBank, EMBL et DDBJ sont chaînées par leur vocabulaire et le numéro des séquences à Medline dans le système ENTREZ et à BIOSIS dans le système GenRref.
En 1988, un réseau, constitué de 22 noeuds, spécialisé en biologie moléculaire, EMBnet est créé pour relier les laboratoires européens, améliorer la diffusion des informations et l'interconnexion entre les banques de données. Le centre de bioinformatique de Villejuif constitue un des noeuds français et son serveur WWW une porte d'entrée aux différentes sources et outils utiles dans ce domaine (http://www.infobiogen.fr)
En 1984, l'American Academy of Dermatology a mis en place à la demande de ses membres un réseau spécialisé en dermatologie, DERM/INFONET, accessible par souscription et offrant à la fois des sources d'informations et des services.
Comme sources disponibles, on trouve une base bibliographique analysant la littérature spécialisée du domaine (43 périodiques), une base sur la thérapeutique (précautions, modalités de traitement), deux bases sur les médicaments (une pour le corps médical et une autre pour l'information du malade), une base d'aide au diagnostic, une base sur les congrès et une base de recueil des données de mortalité et de morbidité sur le mélanome. Ainsi sur une thématique donnée, se trouvent rassemblées différentes sources d'information : du bibliographique au factuel, de l'aide au diagnostic au recueil de données épidémiologiques.
Pour faciliter le travail des membres et intégrer le réseau dans le processus de travail quotidien, divers services sont offerts : la messagerie qui reste le service le plus utilisé, un forum de discussion qui permet de gérer un processus de questions/réponses, un annuaire des membres de divers organismes et associations et des annonces.
Le réseau est accessible en permanence. Des produits multimédia sont à l'étude pour développer l'aspect formation. Nous avons ici une utilisation progressive de systèmes finalisés pour une population de dermatologistes encadrés par une société savante, groupement professionnel qui sert de médiateur et régule les pratiques en assurant les formations nécessaires. C'est à partir d'une réponse à des besoins que les solutions les plus adaptées ont été offertes via les nouvelles technologies, dans un second temps, une extension aux services accessibles par les mêmes technologies a pu se faire, les pratiques ciblées ayant fait leur preuve et montré l'intérêt qu'il y avait à modifier ses façons de faire. L'aspect image est maintenant au coeur de l'évolution du système, le multimédia constitue une offre tout à fait adaptée pour développer la formation continue des dermatologues [ROSENTHAL L.E. 1990].
Vers 1980, A. COCHRANE épidémiologiste recommande vivement que par spécialité ou sous-spécialité soient entreprises des synthèses, bilans des connaissances pouvant être extraites des résultats fournis par les essais contrôlés randomisés et qu'ensuite, un suivi soit assuré. Derrière cette recommandation, il faudra concevoir comment réaliser celle-ci [GOTZSCHE P.C. 1995].
Le processus a été mis en place autour des soins durant la grossesse et la naissance, des revues de la littérature en périnatologie ont été élaborées à partir des résultats des différents essais au sein d'une collaboration internationale coordonnée par l'Unité d'épidémiologie en périnatologie d'Oxford.
Ce travail a conduit à mettre en place un registre des essais terminés ou en cours qui permet de pister plus efficacement les résultats obtenus, publiés ou non. En effet, la pertinence de l'indexation dans les systèmes documentaires ne permet pas de recenser plus de la moitié des essais en question parmi ceux publiés et l'identification de ceux non publiés reste à réaliser.
Les revues produites ont fait l'objet d'un processus de mise à jour et de diffusion par des chaînes éditoriales classiques mais aussi par voie électronique. On peut considérer que le thème périnatalogie a permis d'évaluer faisabilité et schéma organisationnel à mettre en place.
Le principe de la Cochrane collaboration repose donc sur la constitution de groupes collaboratifs. Ils partagent une problématique commune sur un sujet spécifique et adhèrent de façon totalement libre à la volonté de partager une partie de leur activité au sein d'une coordination internationale regroupant compétences et énergie pour éviter de refaire ce qui est en cours ou a déjà été fait. Les étapes comprennent spécification du sujet puis définition des critères d'éligibilité des études à rechercher et mise au point d'une grille d'évaluation des études recensées et affichage des critères d'exclusion. Pour les études retenues, collecte du jeu de données avec pratique ultérieure de méta-analyse. Mise en forme des résultats issus de la démarche.
Chaque groupe constitué obtient les financements nécessaires à la réalisation de ses objectifs.
Des centres aident à la coordination et offrent soutien logistique et méthodologique en :
La question reste posée de l'impact de l'usage de l'information produite à partir des méta-analyses et de ses retombées en terme de changements des pratiques.
En 1992, la Cochrane collaboration tisse des liens avec les bases MEDLINE et EMBASE pour réinvestir le travail de recherche rétrospective qu'elle a dû accomplir.
Le fait qu'elle ne soumette pas systématiquement son travail à un système de référé et que les essais contrôlés randomisés ne soient pas réalisables pour certains secteurs telle la chirurgie ou la prévention du suicide permet qu'elle soit l'objet de critiques. Le chantier entrepris est de taille [GODLEE F. 1994].
L'Europe contribue via BIOMED 1 à ce registre international [BAERT A.E. 1995].
L'arrivée sur INTERNET est donc le résultat d'un processus collectif de partenariat. Ce produit est ciblé et structuré en fonction de questions que l'on veut résoudre. Il a mis en évidence certaines limites des systèmes bibliographiques biomédicaux, mais en les utilisant il incite à un contrôle de qualité de l'indexation et souligne la complémentarité des produits qui se développent.
Devant cette situation de surinformation et de dissémination des sources, des actions ont été menées pour essayer d'extraire l'information "utile, directement utilisable" pour obtenir une vision synthétique et établir un bilan des connaissances. Il existe plusieurs modalités de traitement qui conduisent à offrir des produits différents : revue de la littérature commentée, analyse critique, méta-analyse, conférence de consensus, synthèse de connaissance, expertise collective. La nature de ces produits, leur spécificité, les conditions de surgissement de leur mise en place et les modalités d'organisation qui les sous-tendent constituent des pistes que nous explorerons à la lueur de choix d'exemples. Ces exemples ont en commun de se rattacher à une problématique de diffusion des connaissances scientifiques.
Le principe repose sur la réunion d'un jury sélectionné qui écoutera de façon publique des experts présenter les données disponibles. Un bilan des acquis sera fourni par le jury qui rédigera sur place un rapport et émettra des recommandations qui seront largement diffusées.
Les méthodes d'obtention de consensus sont décrites par FINK A. [1984] ; parmi celles-ci figurent la méthode delphi, celle du groupe nominal, celle du NIH et l'approche par état de l'art de Glaser.
En 1980, la diffusion de la méthodologie du NIH se fait en Europe.
En 1989, est publiée l'évaluation de l'impact de huit conférences de consensus tenues aux États-Unis entre 1979 et 1980.
L'analyse de cette évaluation est reprise par WEILL C. qui relate un seul exemple de succès du point de vue de la modification des pratiques. Il s'agit de la conférence de consensus sur les naissances par césarienne. Le caractère controversé de cette question était perçu par le public et les obstétriciens. La conférence a permis de rassembler l'ensemble des informations sur le sujet et a produit des recommandations précises qu'aucun article de synthèse ne mettait à la disposition des cliniciens.
"On trouvait ainsi un message fondé scientifiquement et intéressant sur le plan clinique, communiqué pour la première fois à une cible consciente de l'existence du problème". Cet exemple a le mérite de souligner que le processus de modification des pratiques ne peut être induit par une simple recommandation issue de la recherche et qu'il est beaucoup plus complexe. Il constitue une exception, en effet la capacité des conférences de consensus à atteindre leur cible est mise en doute par l'évaluation. L'auteur évoque le faible intérêt de la communauté scientifique pour la pratique médicale, les modalités d'appropriation ou d'adaptation des résultats issus de la recherche ne concernent plus les chercheurs et par ailleurs elles se heurtent au scepticisme des médecins à l'égard de la recherche scientifique dans le domaine biomédical. "Si la tradition scientifique conduit à l'innovation et à son intégration modificatrice des pratiques, la tradition médicale est fondée sur l'orthodoxie et l'acceptation de la hiérarchie, d'une part, et sur la recherche de prestige d'autre part." Cela explique l'absence fréquente de relais entre les deux milieux.
L'IARC (agence internationale de recherche sur le cancer) a lancé en 1969 un programme d'évaluation des risques de cancer de substances chimiques chez l'homme. Depuis 1986, ce programme reçoit également le soutien de la Communauté européenne. Revues critiques et évaluation des évidences à un moment donné à partir de la littérature jugée pertinente sont faites par un groupe de travail qui réunit des experts et comporte des observateurs invités. Les méthodes sont décrites dans le volume qui traite de poussière de bois et formaldéhyde [IARC 1995]. Les experts doivent exposer les points de vue de leur discipline et fournir ainsi aux autres experts les éléments de jugement complémentaires à leur approche, travail qui implique une concertation maximale et un désenclavement disciplinaire relatif.
Les monographies sont destinées à fournir assistance aux autorités tant nationales qu'internationales dans l'évaluation des risques cancérogènes pour l'homme pour permettre des prises de décision à visée préventive. Aucune recommandation n'est formulée, la monographie constitue une source d'autorité. L'usage qui en est fait reste externe au producteur.
Les méthodes quantitatives d'exploration de revue de la littérature épidémiologique ont été décrites par GREENLAND S. [1987].
L'intérêt de telles méthodes d'investigation est évident même si les limites en sont ponctuellement visibles [YUSUF S. 1995] et permettent de mettre l'accent sur certaines recommandations parmi lesquelles figure la nécessité d'identifier à la source les études en cours pour contrôler leur devenir en terme de productions scientifiques et de résultats [EGGER M. 1995].
Récemment, le programme BIOMED 1 s'est intéressé à la mise en place d'une unité de coordination de la méta-analyse au sein de l'EORTC (Organisation Européenne de recherche sur les traitements des cancers).
Réalisée par un groupe d'experts réunissant des points de vue et des disciplines complémentaires, l'expertise collective prend appui "sur la capacité des scientifiques à accéder à l'ensemble de la connaissance disponible à un moment donné, sur un sujet déterminé".
"Étape nouvelle du processus de production et de diffusion des connaissances en santé, l'expertise collective constitue une passerelle entre la recherche, le développement, l'évaluation des techniques et pratiques médicales, la dissémination des informations."
Ce qui nous intéresse ici sera l'implication en termes de méthodes à collecter les sources multiples et à parvenir à la maîtrise des différents flux d'information. Interrogations multibases, maîtrise des spécificités des produits et de leur complémentarité incitent à mettre en place des collaborations pour analyser des corpus. Si, comme le précise LEVY P. [1987] : "la plupart des banques de données sont moins des mémoires que des miroirs aussi fidèles que possible de l'état présent d'une spécialité scientifique" ; ici, à partir des sources pistées, il devra y avoir reconstitution d'une mémoire. Les experts représentent les spécialités et les conditions sont réunies pour des validations croisées des sources, via l'élaboration d'une mémoire collective affichée.
A titre d'illustration, nous renvoyons à la présentation du travail d'EPITER [GOLDBERG M 1993].
Qu'il s'agisse d'écriture synthétique faite par un seul individu ou de mise en place de différentes formes de collaboration pour produire une synthèse, un état de l'art ou une évaluation, il y aura toujours en contrepoint l'idée impérative de mettre à jour, c'est-à-dire de réviser, réactualiser. Actuellement cela peut se faire de façon quasi instantanée le processus d'édition étant sous sa forme électronique contemporain de la mise en forme des idées et savoirs.
Accès instantané et délocalisé via une bibliothèque virtuelle a comme corrélat validation vigilante de l'information véhiculée. Il s'agit de réaliser que la technologie ne peut, à elle seule, offrir les possibilités d'un partage réel. La rétention de l'information ne pourra être effaçable que si ses raisons d'être socio-économiques peuvent s'estomper. Nous savons comme JAMOUS H. [1978] l'a mentionné qu'il faut envisager "le modelage institutionnel de l'option technologique" et qu'il convient de "se demander comment une structure sociale et politique dit et fabrique à sa façon un projet informatique d'abord, choisit de réagir de prendre en charge ses effets inattendus ensuite". La polémique qui vient de se développer autour d'ONCOLINK peut être citée à titre d'illustration.
Quelle expertise pour une forme électronique d'écriture ? La référence aux pairs constitue un point d'ancrage. Il n'est pas exclu d'envisager un simple transfert de la procédure actuelle vers l'électronique.
Le processus de revue de la littérature fait lui-même l'objet de recherches. Dans le champ biomédical, le premier congrès international sur le travail de référé pour examen des articles s'est tenu à Chicago en mai 1989. Ces recherches sont donc relativement récentes, elles se sont développées à partir des années 1990 principalement [LOCK S. 1990], [EVANS A.T. 1993] ; le deuxième congrès international sur le sujet s'est tenu en 1994 [ENTWISTLE V. 1995]. Il est intéressant de constater que les éditeurs s'interrogent sur les différentes façons de désigner des lecteurs, l'approche demandant aux auteurs d'indiquer des lecteurs compétents selon eux, étant envisagée depuis peu par certains périodiques [TONKS A. 1995].
Dans ce contexte, il est intéressant de faire référence au
Comité Consultatif National d'Ethique qui vient de rendre public un avis
sur les questions posées par la transmission de l'information
scientifique relative à la recherche biologique et médicale :
"Est génératrice de mauvaises pratiques la logique
institutionnelle qui pousse les chercheurs à publier à tout prix,
en faisant des articles publiés le critère quasi exclusif
d'évaluation du travail et d'attribution des moyens.
C'est la "qualité à la source" de l'information scientifique qui
est ici en cause. Cette question est ancienne ; la résoudre est
difficile. On ne peut cependant que souhaiter la reconsidération des
excès du système là où ils s'observent avec la
valorisation accrue d'autres critères importants de l'activité
des chercheurs, y compris la part prise aux initiatives de diffusion de la
connaissance. Il importe aussi que l'institution scientifique incite à
une transmission totale des résultats de recherche, négatifs
comme positifs. Cette exigence de transmission totale conduit d'ailleurs
à s'interroger du point de vue éthique sur les clauses de
confidentialité partielle imposées aux chercheurs par certains
modes de financement, notamment privés."
Ainsi donc au lieu de participer au processus de mise à jour perpétuel et de réactualisation, on peut envisager dans une logique d'approches finalisées, la mise au point de modules terminologiques validés par l'usage.
Sans répudier thesaurus et nomenclatures, mais en s'y adossant, il devient possible d'adjoindre lors de l'interrogation des ensembles de termes évolutifs et sécables, composés d'éléments jugés adéquats dans une perspective affichée de recherche en marge de la tradition. Ces modules seraient le reflet des fronts de recherche en émergence. Extraction focalisée, cartographie thématique issue d'ensembles plus vastes dont la découpe permettra d'isoler des informations ciblées, de les arracher à des sphères de connaissances qui les accaparent, telles sont peut-être les perspectives à envisager.
CERTEAU M. nous rappelle qu' "être classé, prisonnier d'un lieu et d'une compétence, galonné de l'autorité que procure aux fidèles leur agrégation à une discipline, casé dans une hiérarchie des savoirs et des places, donc enfin "établi" c'était pour Foucault la figure même de la mort".
Ce dont nous avons besoin, c'est d'une gestion dynamique et interactive de l'information.
Pour que la navigation hypertexte puisse être autre chose qu'une performance technologique, il faut par exemple qu'on envisage de l'implanter dans une dynamique de l'interaction entre soignant et soigné. Pour le thérapeute, prendre en compte le contexte organisationnel dans lequel il exerce et parallèlement pour le patient, confronté à sa maladie et au tissu social dans lequel il tente d'inscrire son parcours, offrir des choix. "Je vous donne à voir ma maladie et en échange vous me faites bénéficier d'un cheminement diagnostique et thérapeutique optimal dans une mise en scène dont je souhaite qu'elle ait du sens pour moi au stade de la maladie où je suis." [BREMOND M. 1993]. Permettre au clinicien de mobiliser l'information utile, données épidémiologiques tout comme protocole thérapeutique et information sur la douleur ou le vécu d'un traitement devrait pouvoir s'envisager, le cheminement est affaire de mobilisation des informations produites et de mise à disposition concertée.
Comme dit POINCARE H. : "La science est bâtie de faits de la même façon qu'une maison est bâtie de briques. Mais une accumulation de faits n'est pas plus de la science qu'un tas de briques n'est une maison".
En écho à cette citation concernant la production scientifique, nous renverrons à La vie de laboratoires de LATOUR B. [1988].
© "Solaris", nº 4, Juin 1997.