Revue SOLARIS
Décembre 1999 / Janvier 2000
ISSN : 1265-4876
accueil sommaire du dossier courrier aux éditeurs

       
Approche critique de la pratique de la Text Encoding Initiative, TEI, pour la constitution d'une bibliothèque virtuelle en sociologie

Pierrat Marie-Josèphe


Cyberdocumentaliste.
Service de formation et de documentation Internet.
Institut de Recherche sur les Sociétés Contemporaines
IRESCO-CNRS
59-61, rue Pouchet
75849 Paris Cedex 17
http://www.iresco.fr/
Mél : pierrat@iresco.fr


Octobre 1999

logo Solaris Résumé

L'Auteur décrit rapidement le nouveau système de codage de textes permettant une diffusion structurée de la documentation sur Internet, la Text Encoding Initiative ou TEI, et signale globalement les projets existants.

Elle exprime un certain nombre d'interrogations (à travers un exemple disciplinaire) auquel les disciplines sont confrontées face aux nouveaux systèmes d'écriture et aux nouvelles mémoires " externes ". Dans cette perspective, elle présente le séminaire-atelier mis en place sur l'initiative de l'OBVIES en collaboration avec l'Université Paris 8 et l'Iresco-CNRS dont le projet est de mettre en ligne une base de données virtuelle en sociologie et définit le cadre du projet et son format d'échange. Un bilan des ateliers regroupant des enseignants, des étudiants et des spécialistes de la documentation, des chercheurs et le Loria (CNRS Nancy) donne un aperçu du travail réalisé au cours de l'année : domaines traités, méthodes, corpus. Les problèmes rencontrés quant à l'application pratique et au codage selon la discipline, sont enfin soulevés.

     
Abstract

The Author gives a brief description of a new encoding text system to which allow a structured spread documentation through Internet, the Text Encoding initiative, TEI, and gives a general overview of the existing projects. She submits the seminars they take place in association with University of Paris 8 and the Research Institute on Contemporary societies (IRESCO-CNRS) on the impulse of OBVIES (Observatoire Banlieues, Villes). She specifies the project's framework and the exhange format (size) which is to put on ligne : a Sociological Virtual Library. Then, a workshops assesment, including graduates, fellows, and professionnal in documentation science and the Loria laboratory (CNRS), declines the results which has been realized this year : domains, methods, corpus. At least, she explains the problems which came out in the practice of the domain encoding.







top Introduction

La représentation des documents électroniques selon un format structuré transforme totalement les possibilités d'appropriation des textes et documents par les usagers ainsi que leurs modes de conceptualisation. Aujourd'hui les "normes ouvertes" de l'information structurée permettent un repérage des ressources adapté au fonctionnement en réseaux [1] et le balisage conceptuel peut fonctionner sur la base de consensus entre des sémantiques concurrentielles.

La bibliothèque virtuelle constitue un espace construit et partagé à la fois par les spécialistes de l'information et les chercheurs en sociologie. Si les sciences sociales peuvent investir un espace structuré et normalisé c'est parce que les normes de l'information se sont ouvertes sur "l'arbitraire du code linguistique" [2]. La constitution d'une bibliothèque virtuelle en ligne nécessite de s'inscrire dans une réflexion plus critique et plus ancienne. L'application TEI me semble tenir les promesses de ses fondateurs dans sa définition et ses pratiques ; c'est sur cette base que s'inscrit la mise en ligne de documents numérisés en sociologie.

Dans cette perspective, suite à la décision du Conseil de l'OBVIES [3], de procéder à une démarche coopérative de mise en réseau de littérature scientifique, a été créé un collectif de travail, à l'initiative de H. Hudrisier [4], regroupant des universitaires et chercheurs de l'Université Paris 8 et l'Institut de Recherche sur les Sociétés Contemporaines, Iresco [internet], représenté par des documentalistes auxquelles se sont joints des chercheurs de l'Institut cooptés par les membres du projet [5]. Au niveau technique, ce projet s'appuie sur le Loria [6] expérimentateur et diffuseur de la T.E.I. en France, dans le cadre du serveur SILFIDE [7] [internet].

La T.E.I. est une application issue d'un groupe de travail associant chercheurs en sciences humaines et spécialistes de la recherche en informatique sur une dizaine d'année [8]. Elle repose sur le métalangage SGML [9] mettant en oeuvre des Définitions Types de Documents. L'objectif du collectif était double, d'une part, procéder à une démarche coopérative de mise en réseau, axée sur la signalisation de la littérature grise mobilisable autour de ce domaine de recherche que sont les politiques publiques et, d'autre part, organiser et structurer la mise en forme de ces textes par un balisage généralisé en s'appuyant sur des experts du document, bibliothécaires, documentalistes, éditeurs pour "documenter" un noyau, baliser les textes et contrôler la qualité éditoriale.

Dès cette première approche, en raison de mes activités liées aux nouvelles technologies dans le cadre du Service Internet à l'Iresco, j'ai accepté de participer à ces séminaires et de prendre la responsabilité du groupe de travail sur la pratique de codage des documents.

Après une présentation de la TEI et de quelques projets du réseau international, je définirai le cadre dans lequel nous nous sommes inscrits, puis je présenterai le bilan du groupe de travail sur l'année universitaire 1998/99. Enfin, seront envisagées les perspectives et les coopérations souhaitées pour développer cette approche expérimentale.




1. Présentation de la T.E.I.


1.1 Contexte et origine [10]

Les Recommandations de la TEI -- Guidelines for Electronic Text Encoding Interchange -- plus connues sous l'abréviation de T.E.I.P3 [internet]sont l'aboutissement d'un projet développé, entre 1987 et 1994, au Vassar College de Poughkeepsie, New-York, dont les implications tendent à faciliter l'échange et la circulation des documents électroniques, au sein de la communauté scientifique et à favoriser la constitution de nouveaux savoirs. Les données textuelles constituent la majeure partie des projets actuellement réalisés, mais le codage TEI s'applique également aux données sous forme d'images ou de sons.

L'objectif du codage d'un document au moyen de balises est de rendre "explicite" ses caractéristiques pour ensuite les traiter avec des programmes informatiques.

La TEI se présente sous forme d'une Définition Type de Document (DTD) qui spécifie l'ensemble des règles à appliquer au document. La DTD est modulaire et se décline en trois éléments qui peuvent être associés ou dissociés selon les besoins des utilisateurs.

La possibilité offerte à l'utilisateur de ne sélectionner qu'un nombre restreint d'éléments parmi la multitude de balises et attributs constituant la TEI (plus de 500) permet de générer autant de DTD que de textes à baliser et autorise une grande liberté quant à l'application et à l'ajout éventuel d'éléments pour expliciter des contextes bien particuliers. Cependant, les fonctions d'échange et de circulation induites par la TEI incitent malgré tout à limiter la diversité des définitions-types de documents.

Une DTD débute par une déclaration qui définit le type de document (texte, prose, poésie, théâtre), le type de caractères (cdata), et les différents éléments qui sont utilisés pour le codage avec leurs attributs. C'est à partir de cette déclaration que l'utilisateur va vérifier la conformité du balisage. En balayant le document à l'aide d'un parseur syntaxique, le codeur va repérer les défauts de codage et produire ainsi un document "bien formé" et conforme à la DTD. Suite à la déclaration, un modèle de DTD est appliqué (TEI LITE ou TEI P3 [internet]) dans laquelle le texte est inséré.

Un texte TEI comporte un en-tête balisé comme un élément <teiHeader> et un texte numérisé balisé comme un élément <text>.

L'en-tête a pour fonction de documenter le texte électronique, d'en donner un signalement bibliographique. Nous verrons par la suite l'importance de ce référencement dans un contexte de bibliothèque virtuelle. Il se compose de quatre parties :

Le texte du document s'inscrit dans la balise <text>, il se répartit en trois éléments principaux :

Le texte principal contenu dans l'élément <body> est divisé en fonction de sa structure de base en chapitres et sous-chapitres à l'aide de la balise <div> suivie de la mention de paragraphe <p> correspondant à une section ou subdivision d'un chapitre. À chacune de ces balises peut être appliqué un attribut qui la caractérise, attributs globaux, "id=", "type=" [11] ou attribut de liaison, "ana=" [12].

D'autres balises concernent la numérotation des lignes, balise <l>, pour un texte en vers après indication de la mention de strophe, balise <lg>, ou la numérotation des pages, balise <pb>, suivant ainsi l'édition papier. Un grand nombre de balises facilitent le marquage d'expressions mises en valeur dans un texte, soit au niveau typographique, par exemple, pour indiquer un changement de police avec la balise <hi>, soit au niveau linguistique, par les balises <emph> pour accentuer un effet de rhétorique ou <foreign> pour indiquer une expression en langue étrangère, ou encore <term> pour préciser un terme technique.

La balise <title> est très couramment utilisée pour indiquer le titre d'une oeuvre ou d'une citation au sein d'un texte. Elle est à distinguer du titre d'un chapitre ou d'une section qui sera encadrée par la balise <head>.

Chaque balise ouvrante appelle, en fin de contenu, une balise fermante équivalente, sans possibilité de croisement :

<text>
	<body>
		<div><head>.......</head>
	<p>....</p>
	<p>....</p>
		</div>
	</body>
</text>

En raison de la longueur de la DTD, l'indentation des éléments en facilite la lecture.


1.2 Catégorisation des projets SGML - TEI

Dès l'apparition des Recommandations TEI, en raison d'une réflexion déjà approfondie menée dans les milieux académiques anglo-saxons sur la présentation des documents sur support numérique, un nombre important de projets [13] ont été développés dans le cadre des universités en association avec de grandes bibliothèques ou avec des éditeurs. Il semblerait que peu de nouvelles applications soient en cours depuis un an ou deux.

En listant globalement les projets, on en distingue trois catégories.

Dans la première entrent les projets sur le traitement automatique des langues, associant des programmes informatiques à l'ingénierie linguistique, la lexicographie, le traitement des dictionnaires. Ces recherches utilisent de grands corpus de textes pour la mise au point de modèles de langage. Le projet Silfide, Serveur Interactif pour la Langue Française, son Identité, sa Diffusion et son Etude en est un exemple. Projet conjoint du CNRS et de l'AUPELF-UREF [14], il donne accès, de façon conviviale et raisonnée, à des ressources textuelles ouvertes à l'ensemble de la communauté universitaire travaillant à partir de la langue, linguistes, enseignants, informaticiens, par l'intermédiaire d'un réseau de serveurs. Le développement d'outils informatiques facilite l'accès à des recherches en texte intégral à partir de plusieurs index, auteurs, titres, langue. Silfide propose différentes visualisations des résultats avant l'accès au texte. Les ressources sont codées en SGML et conformes aux directives de la TEI. Actuellement Silfide transpose les données de la base FRANTEXT [15] selon la DTD TEI. Le Corpus Encoding Standard (CES) développé par N. Ide et J. Veronis, pour le codage de corpus à des fins d'ingénierie linguistique, a été testé dans plusieurs projets internationaux comme MULTEX [16] et les actions de recherche partagée de l'AUPELF-UREF avec le serveur Silfide du CNRS.

Les projets mis en oeuvre par des éditeurs entrent dans la seconde catégorie. Ces applications visent à standardiser l'édition de collections de documents au format SGML, selon une DTD définie par l'éditeur lui-même. On peut citer en exemple les Presses de l'Université de Cambridge ou les Presses de l'Université de Montréal, et plus récemment l'éditeur Elsevier pour ses publications de revues. Dans le même esprit, un projet de numérisation des thèses et mémoires, l'Electronic Thesis and Dissertation Project [17] de l'Université de Virginie se développe en association avec l'University Microfilms International (UMI [internet]) pour créer une DTD spécifique, mais conforme au format SGML qui contiendrait les éléments définis pour ce type de documents. L'UMI [18] est le plus grand fournisseur de documents scientifiques dans le monde académique de la recherche et de l'enseignement, tant au niveau des périodiques et des journaux qu'au niveau des thèses issues des universités du monde entier. Même si ces projets n'appliquent pas directement la DTD TEI, ils participent de cette volonté de structuration de l'information sur la base du métalangage SGML.

Enfin, d'autres projets se fondent sur la numérisation de corpus spécifiques à des fins d'archivage. Les projets sont nombreux et couvrent différents pays. Nous pouvons citer le Victorian Womens Writers Project [19], réalisé à l'Université d'Indiana, la collection de textes numérisés de l'Université de Virginie [20], qui s'appuient sur la TEI Lite, ou encore l'American Memory Project [internet], réalisé plus récemment par la Bibliothèque du Congrès (Washington) [21], ainsi que le Voltaire Foundation à l'Université d'Oxford [22] qui s'appuie sur la TEI P3.


1.3 Comment la TEI permet des échanges de documents ?

La DTD TEI permet la codification de la dimension logique du document, indépendamment de son contenu et de sa forme, facilitant ainsi sa portabilité et son traitement par des applications variées.

Du point de vue des concepts, on distingue les balises procédurales (Duchet, 1998), qui donnent une représentation du texte à l'écran, des balises descriptives, qui décrivent la pertinence d'un texte au niveau de son contenu. Les balises de structuration logique, <div>, <p>, normalisent le document et en facilitent la lecture puisque le lecteur pourra aisément repérer, à l'écran, les différents chapitres, sections et sous-sections d'un texte, ce qui n'est pas toujours le cas lors de l'utilisation de la DTD HTML, plus pauvre au niveau du codage. De plus, si les navigateurs courants ne lisent pas encore le format SGML [23], il est très aisé de transformer la TEI en HTML, et de moduler la présentation écran en fonction des besoins de l'utilisateur, par exemple l'édition sous forme de tableau ou de graphique.

D'autre part, le jeu de balises descriptives, généralistes au niveau SGML, peut être typifié par des attributs qui spécifient leur emploi dans le corps du texte. Ainsi, un chercheur peut pointer précisément des concepts, <name type="concept"> ou une méthodologie particulière ou encore un développement méthodologique dans un paragraphe donné. Ainsi, à travers une simple technique de balisage, le sociologue fait apparaître et met en jeu une sémantique concurrentielle.

Actuellement, les utilisateurs du réseau peuvent facilement échanger des fichiers par l'intermédiaire de la fonction FTP [24] ou par le biais de la messagerie électronique. Alors que ces échanges sont individualisés, la TEI constitue des bases structurées rassemblant, sous forme de "corpus" ou de bibliothèque thématique, des données accessibles au lecteur dans un cadre bien défini, en général académique, lui donnant une garantie quant à la qualité et à la validation du document numérique.

Enfin, la TEI offre un réseau d'applications avec toutes les possibilités de contacts, d'échanges et d'aide qui y sont liés, en particulier dans un processus d'évolution des standards de la DTD TEI et des outils servant à l'interrogation des documents. Si une partie des projets normalisés selon la TEI est consacrée à la mise en ligne d'archives, le balisage participe à l'activation du texte et à son interrogation au moyen d'outils spécifiques qui sont à développer. C'est par ce travail sur le texte que peuvent apparaître de nouveaux savoirs, dans un processus de lecture-écriture avec la participation active du lecteur.




2. Cadre d'appui à la réflexion du séminaire - atelier.


2.1 Cadre du projet

Les informations présentées sur le réseau de réseaux sont énormes en masse, difficiles à atteindre et parfois redondantes. Les outils de recherche se multiplient et promettent ce qu'ils ne peuvent tenir jusqu'à présent, à savoir l'accès à toutes les données de la toile, l'espace cyber étant insondable. D'où la nécessiter de participer à des réseaux qui existent déjà sur le Web, en particulier les réseaux de recherche au niveau national et international. C'est dans ce contexte que les professionnels de l'information et de la communication peuvent et doivent agir en utilisant leur savoir-faire.

Celui-ci passe, en premier lieu, par une normalisation sophistiquée de l'information à mettre en ligne permettant de localiser des ressources selon différentes approches conceptuelles, de maîtriser des bases de ressources, et de construire un espace référentiel virtuel qui prend en compte les textes et documents selon leurs différentes facettes et divers appareils de métadonnées. En second lieu, ce savoir-faire facilite l'insertion dans des réseaux organisés et actifs.

L'émergence du World Wide Web, l'accès démultiplié à un nombre toujours plus grand et varié de documents numériques, a considérablement accru la nécessité d'une réflexion forte sur les pratiques émergentes concernant la structuration des nouvelles mémoires.

L'idée de communiquer des textes directement sur le Web a vu jour dans les bibliothèques nord-américaines (Teasdale, 1996 ; Beaudry, 1996), plus avancées sur les possibilités de partage des collections en termes de contenus. Avec quelque retard, ces pratiques se développent également, en France, dans le cadre de bibliothèques virtuelles, l'exemple le plus direct étant la bibliothèque virtuelle Gallica, éditée par la Bibliothèque Nationale de France.

Notre projet s'inscrit dans une telle philosophie de diffusion large de l'information par le biais du réseau de réseaux. L'intérêt de créer une bibliothèque virtuelle répond d'abord à la nécessité de mieux diffuser la production scientifique au niveau national, auprès des différents partenaires concernés. Elle répond ensuite à une diffusion large, internationale ; la production scientifique des chercheurs ayant tendance à rester locale et peu répertoriée au-delà de nos frontières. Le projet encore embryonnaire et local pourrait donc s'élargir et associer l'ensemble de la communauté des sociologues.

La mise à disposition de textes scientifiques en sociologie selon un format s'appuyant sur la norme SGML - TEI optimise la fonction de normalisation des documents par leur insertion dans un cadre de réseaux déjà important quant au nombre des participants. Par ailleurs, les projets développés sont majoritairement anglo-saxons. Dans ce contexte, la bibliothèque virtuelle en sociologie accroît la participation française [25], et élargit qualitativement les domaines d'application puisqu'il n'existe pas de base textuelle s'appuyant sur la TEI dans la discipline.

Par ailleurs, ce projet s'inscrit dans le cadre plus global d'une dissémination de la TEI qui prend la forme d'un projet de Paris 8 et du Loria dans lequel l'Iresco est partenaire.


2.2 Le choix du format de normalisation

Voyons maintenant l'intérêt de coder des documents scientifiques selon la DTD T.E.I. au format SGML et l'impact sur la normalisation des documents pour leur diffusion et leur échange.

À l'exception du texte brut, au format ASCII [26], tous les documents électroniques présentés sur le réseau de réseaux sont codés d'une façon ou d'une autre. Les formats les plus courants sont, d'une part, l'HyperText Markup Language (Html), considéré comme la "lingua franca" du réseau, développée à partir d'une DTD simplifiée de la norme SGML sur les serveurs de type Web et, d'autre part, le Portable Document Format (PDF), format propriétaire développé par la Société Adobe.

Le format PDF est un format très utilisé dans l'édition car il insiste sur la présentation formelle du texte numérisé. Le texte est à l'image du produit édité, mais comme tout format de type image (.gif ou .jpeg) l'utilisateur ne peut revenir sur le texte pour le retravailler. Il ne peut que le visualiser et si nécessaire, l'imprimer.

Le HTML, qui est aussi une DTD issue de la norme SGML, ne propose pas une structuration forte du document numérique. Par ailleurs, les balises, en nombre limité, ne permettent pas de séparer le fond de la forme du document, dans sa présentation, même si le développement de feuilles de styles sur la base de la version 4.0 améliore la présentation visuelle des données.

Dans notre groupe de travail, deux ou trois chercheurs ont déjà travaillé sur l'approche conceptuelle du balisage qui, associé à la maquette élaborée par le groupe documentaire, amorce à l'Iresco une pratique d'édition sociologique structurée et partagée en réseau.

Cette pratique vérifie les qualités de la DTD T.E.I., à la fois structurante et modulable, qui lui permet de s'adapter à des contextes très variés dans ses domaines d'application et dans ses modes de visualisation. Par ailleurs, l'application est issue du langage SGML, reconnu par le Consortium W3 et disponible gratuitement sur le site du Consortium ainsi que sur certains sites de référence. C'est donc un format qui va perdurer. En cela, il répond à la question de l'archivage des données sur le Web. Si le standard évolue, la TEI évoluera de pair. Nous voyons bien le sens de cette évolution avec l'apparition du nouveau langage XML. Ainsi depuis juin 99, les travaux conduit dans les groupes de travail de l'IETF [27] ont abouti à une première version associant la DTD TEI Lite au langage XML (Cover, 1999). Cette première recommandation est encore expérimentale et n'a pas été beaucoup testée, c'est pourquoi nous attendons d'autres développements avant de nous lancer dans un changement de langage.




3. Bilan du séminaire-atelier balisage


3.1 Les séminaires et ateliers

L'objectif des séminaires de méthode a été d'assurer une diffusion large du projet auprès de chercheurs, d'étudiants et de documentalistes intéressés par la création d'une base de données en texte intégral accessible sur le réseau de réseaux.

Les deux premières séances furent consacrées, l'une à la présentation des participants et à leurs attentes par rapport aux objectifs du séminaire de méthode et l'autre à la présentation de la T.E.I. par F. Role, conservateur détaché du Ministère de l'Éducation Nationale, de l'Enseignement Supérieur et de la Recherche auprès de l'Université Paris 8, traducteur de la T.E.I.Lite, version abrégée en français de la T.E.I.P3. Les deux séances suivantes ont porté sur la connaissance de l'environnement des outils de balisage de textes à partir de présentations concernant, d'une part, le Groupe de recherche Silfide, Loria et ses travaux sur le codage de documents numérisés avec pour exemple la présentation du projet DHYDRO, dictionnaire trilingue hydrographique et, d'autre part, l'approche du milieu économique et des procédures complexes de mise en réseau de la monnaie par l'intermédiaire d'une carte à puce numérique. Dans un troisième temps, quelques exemples illustrant le processus de codage à partir de textes littéraires ont été exposés par une enseignante-chercheur rattachée à l'INRP.

Ces séminaires ont débouché sur la proposition de constitution de trois ateliers :

Seul l'atelier "en-tête" [28] a fonctionné cette année, mais, avec la participation ponctuelle et active de chercheurs à nos séances mensuelles, nous avons également travaillé sur le balisage des contenus. Les deux premières réunions de travail ont eu pour objectif de reprendre les principes directeurs de la DTD de la T.E.I. Lite. En février, les 15 participants du stage pratique de deux jours [29], essentiellement des documentalistes et des étudiants en D.E.S.S. ou D.E.A. en documentation et nouvelles technologies, ont pu mettre en application l'approche théorique du balisage propre à la T.E.I. sur des textes numérisés proposés par des chercheurs des divers organismes participants.

Le bilan de ce stage a mis en lumière les spécificités des textes sociologiques plus complexes à documenter que les textes littéraires sur lesquels s'appuyait le stage.

Un groupe de travail, étudiants et documentalistes, a amorcé une réflexion sur la définition des balises T.E.I. et leur utilisation dans le cadre de la DTD pour créer un document type de balisage applicable aux textes spécifiques de notre domaine sociologique. Ce groupe de travail a préparé le stage long prévu au Loria, en mars 99. Lors de ce stage [30], nous avons perçu plus clairement les enjeux de l'utilisation de la T.E.I et l'intérêt de structurer les données par l'association de présentations théoriques et de groupes de discussion. La partie théorique a porté sur une présentation globale du standard SGML et de la TEI, sur une présentation du nouveau langage XML, et l'une de ses applications à l'édition du document XSL [31], ainsi que sur une présentation du travail éditorial de Silfide. Dans les travaux pratiques afférents au stage, les stagiaires parisiens ont abordé les difficultés rencontrées au niveau de la définition des balises de l'en-tête. Certains problèmes ont été clarifiés, comme la mention de titre du document numérique et son auteur, la notion de disponibilité et d'édition électronique.

D'autres points relevant de la spécificité de nos textes, en particulier les points concernant la littérature grise, sont restés en discussion.

Le Loria ayant fourni les outils de travail, en particulier le logiciel Emacs, l'Iresco a mis à disposition de l'atelier des codeurs, une salle de travail équipée de matériel informatique. Sur l'année, une vingtaine d'étudiants et documentalistes ont suivi régulièrement les stages et ateliers.


3.2 Le corpus

Lors des premiers séminaires de méthode, il est apparu assez rapidement que la notion de littérature grise pouvait varier au niveau de sa définition et que son recensement restait difficile sinon délicat car il relevait, en grande partie de la "bonne volonté" des auteurs à fournir l'information, en raison de son caractère non officiel.

Ce projet étant actuellement expérimental, nous avons donc opté pour une littérature plus accessible, celle que les chercheurs accepteraient de mettre à disposition pour un travail informel au sein des ateliers et celle que nous irions chercher parmi les textes fondateurs de la discipline. Grâce à la diversité des documents collectés, nous avons testé le balisage T.E.I. sur des textes très différents des oeuvres littéraires classiques, à la fois au niveau de la structuration formelle des textes et au niveau de leur typologie, articles édités, lettres, texte électronique non publié, chapitres d'ouvrages numérisés, préface. D'une certaine façon, chaque document posait des problèmes spécifiques que nous avons notés sans pour autant apporter de solution sur l'instant.

Alors que nous étions partis sur une circulation large pour la constitution des données textuelles, l'abandon de certains organismes participants d'une part, et la participation active de l'Iresco, d'autre part, tant au niveau organisationnel que de la présence aux ateliers, documentalistes et jeunes chercheurs en sociologie, sans oublier les textes collectés par l'ensemble du groupe, nous a renforcés dans la décision de se centrer sur la constitution d'un seul corps de documents et d'avancer dans la création d'une bibliothèque virtuelle en sociologie. Par la bibliothèque de sociologie du CNRS, l'Iresco a un fonds très riche dans la discipline. Il reste à déterminer les orientations de la base textuelle au niveau des documents fondamentaux et des concepts constitutifs de champs spécifiques, par exemple " la*cité " ou " rapports sociaux de sexe ", ou vers des documents constitutifs de champs spécifiques. En raison de notre association avec l'Université Paris 8, nous avons également la possibilité de prospecter auprès des étudiants en sociologie (maîtrises et DEA).

En tant que responsable du groupe de travail, mon intérêt, lié à celui de l'Iresco, va également en ce sens.


3.3 La méthode

Après avoir travaillé à partir de la TEI Lite, nous nous sommes rendu compte que le travail sur la compréhension des balises était lourd et que la traduction française, reprise de la version légère anglaise, était difficile à comprendre en raison d'un manque de cohérence dans les exemples proposés. Il est devenu évident de compléter cette première approche avec les Recommandations de la TEI P3 [32], accessible en ligne sur le site de l'Université de Virginia [33] [internet]. Malgré la difficulté due à la compréhension d'un texte technique en langue étrangère, la plus grande diversité des balises et des attributs proposés ainsi que des cas cités en exemple, ont facilité la compréhension globale des Recommandations. Nous avons donc travaillé sur les deux documents en alternance.

Pour l'instant, nous n'avons fait qu'entrevoir les multiples possibilités de codages car nous n'avons pas encore étudié la totalité des documents source. Autant le balisage procédural de la partie texte nous a paru simple, à un premier niveau d'application, autant l'en-tête pose un certain nombre de questionnements.

Il est apparu que les difficultés relevaient à la fois de la diversité des documents numérisés, plus complexes que des textes littéraires, qu'ils soient en vers ou en prose, et de la simplification de certaines parties de l'en-tête, en particulier l'élément correspondant au référencement du document source.

Dans l'état actuel de nos connaissances de la T.E.I. et de ses applications, nous devons commencer par définir ce que nous voulons voir apparaître au niveau de l'en-tête puis chercher dans les Recommandations les possibilités offertes pour arriver à une adéquation satisfaisante. Pour des professionnels de la documentation, la partie "Source du document" ne permet pas un référencement suffisant et d'autres solutions seront à trouver pour arriver à intégrer les modes bibliographiques classiques dans l'en-tête du document numérique.

Principes généraux retenus :




4. Problèmes actuellement rencontrés


4.1 Problèmes liés à la numérisation des documents.

Dans une présentation du VWWP (Willet, 1996) [34], P. Willet explique très simplement les difficultés inhérentes à l'implantation d'une bibliothèque virtuelle, tout d'abord au niveau de la collecte des données, puis de leur traitement numérique et éditorial, passage d'un document papier à un document numérisé. Il définit son choix au niveau du format d'édition par le fait qu'il s'appuie sur un standard qui perdurera dans le temps, au niveau technique, indépendamment des plates-formes et logiciels utilisés et au niveau de l'usage qui pourrait en être fait, c'est-à-dire la recherche dans le texte et l'édition sous multiples formes.

La numérisation est une activité lourde en temps, car elle suppose non seulement la scannerisation des pages mais également un travail éditorial de relecture pour la correction des coquilles qui n'ont pas été détectées par le logiciel de reconnaissance de caractère. Pour certaines éditions d'ouvrages, la qualité du papier impose la photocopie du document avant scannerisation. Il est donc apparu que nous devions constituer une équipe qui prendrait en main cette activité, en amont de l'activité de codage. Pour une plus grande autonomie de l'atelier, nous avons fait l'achat d'un scanneur qui est relié à un poste de travail.


4.2 Problèmes au niveau de l'approfondissement de la T.E.I.

L'intérêt de la TEI réside dans l'enjeu fondamental des "normes ouvertes" et de l'information structurée. Elle suppose que ses utilisateurs maîtrisent d'un côté, une bibliothéconomie jouant sur le niveau des sources papiers traditionnelles et des documents et méta-documents virtuels partagés en réseau et, de l'autre, des conceptualisations selon des sémantiques concurrentielles. Elle a ouvert la piste de ces nouvelles approches de la réalité sociale qui se déploie actuellement sous l'impulsion du langage XML (Hudrisier, 1999) [35].

En raison de son grand nombre de balises disponibles, la TEI est difficile à manier. Comme le soulignent Nancy Ide et Jean Veronis (1996) " le jeu de balises qu'elle offre est à la fois trop riche et trop pauvre pour une application donnée". Dans un premier temps, il fut difficile de distinguer dans les éléments proposés ceux qui nous seraient utiles. Il faut un certain temps de maturation pour comprendre le potentiel des éléments proposés et les imbrications entre balises et attributs qui démultiplient les possibilités des balises de base. Une autre difficulté fut de comprendre le sens des balises, pas toujours explicité par les exemples proposés dans les Recommandations. Le travail en groupe restreint, avec les documentalistes et étudiants qui seront ensuite en charge de ce processus, nous a permis d'avancer dans la compréhension de l'ensemble du langage SGML et de la DTD TEI. et de définir les balises nécessaires au codage des textes. Ce travail de base commun était préparatoire à une dissémination du projet en sous-sections liées à des corpus spécifiques.

À partir du travail effectué cette année, il semble que le balisage des textes selon la Text Encoding Initiative nécessite un travail en deux temps. Le premier temps correspond à l'encodage de base de l'en-tête et du corps du document. Dans un deuxième temps, pour les textes d'actualité, le chercheur ajoute ses propres éléments pour affiner le balisage conceptuel.


4.3 Problèmes liés au codage de l'en-tête

Comme nous l'avons vu précédemment, nous avons travaillé essentiellement sur l'en-tête de la DTD TEI. L'en-tête référence à la fois le document électronique (titleStmt, publicationStmt, seriesStmt, notesStmt) et le document source (sourceStmt).

La partie <fileDesc> qui est censée décrire le document numérique contient des éléments qui renvoient de fait au document source. Ainsi la mention de "version électronique" dans le titre du document est bien un rappel que ce document a existé sous une autre forme, avec un autre support. Cette précision, que nous retrouvons systématiquement dans les bases virtuelles, nous paraît redondante car un document numérique est à la fois unique et original et ne renvoie qu'à lui-même, mais nous nous y sommes conformés. Si la mention de "version électronique" renvoie au contenu, cela signifierait qu'il peut y avoir des différences entre les deux produits, électronique et papier, et il faudrait alors en préciser la teneur dans le <profileDesc>.

Le point le plus lourd de nos discussions a porté sur la partie <sourceDesc>. La TEI propose trois possibilités de référencement du document source :

Ces deux éléments documentent aisément un ouvrage ou un article mais sont incomplets pour tout document entrant dans le registre littérature grise, rapports, mémoires et thèses, puisqu'il n'y a pas les éléments suffisants pour noter des mentions de lieu et organisme de soutenance, etc.

Partant du constat de la multiplication des références bibliographiques en raison de l'accès à un grand nombre de catalogues de bibliothèques en ligne et de la difficulté à localiser ces documents et par-là même d'accéder à leur contenu, il est apparu comme une nécessité d'utiliser l'élément <sourceDesc> pour documenter le mieux possible le texte électronique.

Si l'on consulte l'élément source de l'en-tête type utilisé dans plusieurs projets, aussi bien au Loria pour le signalement bibliographique des documents de FRANTEXT, qu'à l'Université de Virginia, ETEXT [internet], on s'aperçoit que le référencement du document original est très succinct. L'élément BIBLSTRUCT dédié à la description des sources bibliographiques, tout au moins dans l'élément <sourceDesc> ne nous est pas apparu suffisant pour valider l'information que nous avons à référencer pour obtenir une notice bibliographique de qualité. Cette partie est à définir et à développer, particulièrement pour le corpus littérature grise.

Or, en raison de la difficulté à localiser les documents sur le réseau et à trouver des documents qui soient validés scientifiquement, il nous semble que la bibliothèque virtuelle peut jouer le rôle cumulatif de catalogue de références associé au texte intégral et remplacer à terme le catalogue bibliographique traditionnel. Si l'on considère que ce mode de balisage permet d'intégrer dans un même cadre, les fonctions jusqu'à présent dissociées que sont la référence d'un document et l'accès au texte.

Un autre point de discussion concerne la filiation des documents entre eux. Dans le cas de la littérature grise, il est fréquent qu'une thèse soit le point de référence de plusieurs travaux qui vont prendre forme, articles, ouvrage. Il peut être utile de faire le lien entre le document d'origine et ses "dérivés" ou développements, et inversement. Les pointeurs sont-ils suffisants ?




5. Développement du projet


5.1 Diffusion et coopération

Au cours du premier semestre 99, le projet de bibliothèque virtuelle selon l'application TEI a fait l'objet de deux présentations : l'une, au Laboratoire d'Informatique de l'Université Paris 6 (LIP6), dans le cadre d'un séminaire sur la définition de la norme Mpeg4 [36] ; l'autre, au Cnam, dans le cadre des ateliers du séminaire "Unicode et après" [37].

Actuellement, le projet de bibliothèque virtuelle en sociologie est embryonnaire dans la mesure où il n'a fait l'objet que d'une année d'expérimentation. Pour se développer, il nécessite la constitution d'un groupe de travail associant chercheurs et documentalistes pour se mettre en situation d'un référentiel commun de balisage.

Par ailleurs, au niveau des textes constitutifs de la bibliothèque virtuelle, il serait envisageable d'établir des coopérations avec des organismes ayant déjà des contenus numérisés. L'INaLF [internet] avec qui nous avons déjà établi des contacts professionnels pourrait nous fournir des textes électroniques à partir desquels nous appliquerions le mode de balisage T.E.I.. Mais d'autres contacts pourraient être envisagés auprès de bibliothèques virtuelles déjà présentes sur Internet et qui ont déjà des textes numérisés qui s'apparentent à la sociologie [38].

Par ailleurs, une prise de contacts auprès de responsables de projets T.E.I. du réseau international est à envisager pour échanger sur les modes de balisage spécifiques à d'autres disciplines, l'histoire par exemple, et sur les difficultés rencontrées et les modes de résolution de problèmes envisagés. Cet aspect " prospectif " du projet est une nécessité liée, entre autres, à sa reconnaissance en tant que projet introduisant un nouveau champ disciplinaire dans le réseau des projets TEI.

Enfin, la bibliothèque de sociologie de l'Iresco possède les grands textes fondateurs de la discipline qu'il conviendrait de traiter sous forme numérique avant d'appliquer le balisage propre à la TEI.

Ce projet étant encore dans un cadre expérimental, nous n'aborderons pas ici les questions liées aux droits de propriété intellectuelle.


5.2 Plan de travail

Nous sommes conscients que l'information circule maintenant sous forme de réseaux. Pour la communauté des sociologues français, l'intérêt de s'intégrer aux réseaux de communication réside en premier lieu dans une meilleure circulation de leur production scientifique. Une production scientifique locale et à diffusion restreinte n'est pas répertoriée au niveau international. Par ailleurs, la sociologie française est différente dans son approche, ses méthodes et ses concepts d'autres sociologies développées dans d'autres pays européens, en Allemagne ou aux États-Unis, par exemple. L'intérêt de créer une bibliothèque virtuelle répond d'abord à la nécessité de mieux diffuser la production scientifique au niveau national, auprès des différents partenaires concernés. Le projet encore embryonnaire de constituer une base de textes sociologiques en ligne pourrait, au-delà du cadre de l'Iresco, associer l'ensemble de la communauté des sociologues. Nous devons prospecter en ce sens. Dans un second temps, l'inscription de la sociologie dans les projets s'appuyant sur la TEI lui permet de s'insérer dans le réseau des bibliothèques virtuelles utilisant ce type de format ; nous serions alors la première bibliothèque virtuelle en sociologie au format TEI.

Pour préparer les séminaires et ateliers de l'année 1999/2000, je me suis appuyée sur les connaissances techniques du Loria pour travailler sur une définition plus précise des en-têtes des documents, définition qui correspond au type de documents que l'atelier des codeurs aura à baliser dans la discipline.

J'ai repris les textes travaillés par les étudiants durant l'année et les ai mis en conformité avec l'en-tête ainsi définie. Une maquette accessible sur le site de l'Iresco [39] présente une partie des travaux ainsi balisés : les en-têtes des documents sont au format HTML. Un texte électronique est également présenté en totalité, avec accord de l'auteur.

Cette maquette servira de base aux travaux que nous allons poursuivre sur les textes, associant textes fondamentaux et textes contemporains, avec la participation des chercheurs. Nous allons oeuvrer pour constituer un Comité scientifique pour le choix des textes à baliser, en particulier pour les textes sociologiques fondamentaux.

Par ailleurs, il serait intéressant de constituer deux groupes qui participeraient, en alternance, au travail éditorial de base, scannerisation des pages et relecture des épreuves numériques, et au travail de balisage des textes numérisés. Cela permettrait à chacun d'acquérir une double compétence et la connaissance complète du processus de mise en ligne des documents avec la transformation du code de base en application HTML ou XML, par l'intermédiaire de feuilles de styles, pour la visualisation des documents.

Sous-jacent à ce savoir-faire sociologique de l'information structurée, le séminaire TEI de l'Iresco consacrera une part importante de sa réflexion théorique à l'appropriation, par les membres participants, d'une pratique de conceptualisation dans le cadre de sémantiques concurrentielles.




Conclusion

Ce papier est une note d'étape et doit être considéré comme tel à l'intérieur des pratiques que nous sommes en train de définir. L'examen critique de l'application TEI a permis d'en souligner les avantages au niveau de la structuration des textes et de la conceptualisation mise en jeu dans les pratiques de balisage, ainsi que les difficultés de diffusion dans des pratiques élargies, au-delà d'un cercle de professionnels. La distinction entre balisage procédural et balisage descriptif facilite le repérage de l'information et son traitement a l'aide d'outils de recherche, indépendamment des plates-formes et logiciels de ses usagers. La DTD est souple et s'adapte à tous les contextes scientifiques. Les balises ont un caractère générique, mais peuvent par le biais d'attributs s'adapter à des contextes spécifiques, comme celui de la sociologie. Cependant, la TEI demande à être développée au niveau d'interfaces qui simplifient les procédures de codages si l'on souhaite qu'elle soit utilisée par des chercheurs comme un processus d'écriture. Le meilleur exemple est la fonction "annotation" du traitement de texte qui correspond assez bien processus de balisage du document dans la mesure où l'annotation est une clé de lecture, un marquage personnalisé d'un texte par l'utilisateur. En ce sens, nous pouvons dire que le balisage est une écriture, car il permet de lire autrement un corpus, des archives. Comme le lien hypertexte, par le balisage, l'utilisateur a la possibilité d'entrer dans un texte à plusieurs niveaux, sans être obligé de suivre le déroulement de ses parties et d'établir des comparaisons par la mise en concordance de multiples documents en s'appuyant sur le déclaratif standard de la DTD. L'enjeu actuel de la TEI réside donc dans une simplification de l'accès au balisage pour accroître sa diffusion auprès des producteurs de textes scientifiques, les chercheurs eux-mêmes. Nous pouvons penser que le développement d'interfaces conviviales permettrait une diffusion plus large de ses potentialités en tant que standard et un accroissement du nombre de projets dans le milieu de la recherche française. A cela s'ajoute la mise à disposition d'outils de recherche sur le texte pour que le balisage soit utilisé dans ses objectifs, c'est-à-dire faciliter le développement d'une critique de l'interprétation des textes, par la mise en parallèle et la comparaison d'éditions de plusieurs textes, par l'étude du contenu sémantique des textes scientifiques, et qu'il participe ainsi à l'élaboration de nouveaux savoirs.




top Notes

1
Un en-tête d'information structurée doit distinguer la source des diverses versions électroniques et de l'appareil des métadonnées.

2
Au sens saussurien du terme.

3
OBVIES, Observatoire des Banlieues, de la Ville et de l'Innovation Economique et Sociale.

4
Un colloque de trois jours en juillet 1998, à l'Université Paris 8 sur la TEI a servi de déclencheur pour la constitution du groupe Projet TEI..

5
Outre les partenaires cités précédemment, se sont associés, au premier semestre, des chercheurs et documentalistes de l'INRP et du CRDP de Créteil.

6
Loria, laboratoire lorrain en informatique et automatique de Nancy.

7
SILFIDE, Serveur Interactif pour la Langue Française, son Identité et son Etude.

8
Les trois fondateurs sont Nancy Ide, Lou Burnard et M.C. Sperberg-McQueen.

9
Standard Generalized Markup Language (norme ISO 8879 - 1986).

10
Pour cette présentation, je m'appuierai sur la présentation de la TEI LITE réalisée dans le numéro spécial des Cahiers Gutenberg (1996) et plus particulièrement sur les articles de L. Burnard et C.M. Sperberg-McQueen, J. André et F. Role.

11
Type spécifie le type de balise qui le précède.

12
L'attribut "ana" relie un élément à son interprétation.

13
Cf. TEI Application Page Project description <http://www.oasis-open.org/cover/acadapps.html>

14
AUPELF-UREF, Association des Universités Partiellement ou Entièrement de Langue Française - Unité Réseau en Français.

15
Frantext est la base sur la littérature française produite par l'INaLF, Institut National de la Langue Française.

16
MULTEXT, Multilingual text Tools and Corpora.

17
Cf. Virginia Tech Electronic Theses and Dissertations http://scholar.lib.vt.edu/theses/theses.html>.

18
Cf. UMI <http://www.umi.com/>

19
Cf. Victorian Womens Writers Project <http://www.indiana.edu/~letrs/vwwp/index.html >

20
Cf. Etext University of Virginia <http://etext.virginia.edu/>

21
Cf. American Memory Project <http://lcweb2.loc.gov/ammem/>

22
Cf. Voltaire Foundation <http://www.voltaire.ox.ac.uk/voltaire_french.html>

23
Panorama, créé par SoftQuad Company, est un navigateur qui visualise le format SGML et l'application TEI.

24
FTP, File Transfert Protocol, fonction de chargement ou déchargement de fichiers à partir d'un ordinateur.

25
Il n'existe que trois projets français, AQUARELLE, OPERA et SILFIDE, tous deux portés par l'INRIA.

26
ASCII, American Standard Code for Information Interchange.

27
IETF, Internet Engineering Task Force, organe de l'ISOC, Internet Society, qui fédère des groupes de recherche sur les développement des protocoles.

28
Une journée mensuelle en alternance avec des stages longs.

29
Stage organisé à Gif-sur-Yvette, co-animé par L. Romary (Loria) et F. Role (Paris 8).

30
Stage au Loria, co-animé par L. Romary, N. Belhalem et N. Viscogliosi.

31
XSL, eXtended StyleSheet Language, feuilles de styles du XML.

32
Expression autorisée traduisant les Guidelines for Electronic Text Encoding and Interchange. La P3 étant la version complète de la TEI.

33
University of virginia <http://etext.virginia.edu/TEI.html>

34
Perry Willet est le responsable éditorial du Victorian Womens Writers Project.

35
Le système de balisage sémantique de XML est dans une certaine mesure héritier des savoir-faire expérimentés par la TEI.

36
Séminaire sur le format de normalisation des images animées et vidéos sous la responsabilité conjointe de P. Faudemay et H. Hudrisier.

37
Organisé par S. Baste et sous la responsabilité de H. Hudrisier.

38
Par exemple l'ABU, Association du Bibliophile Universel dont les textes sont au format ASCII.

39
Cf. <http://www.iresco.fr/ressources/sociotextes.html>




Bibliographie

retour
ANDRÉ, Jacques (1996). "Balises, structures et TEI". In : Cahiers GUTenberg, nº24, juin 1996, pp.11-22.

retour
BEAUDRY, Guylaine (1996). "La Text Encoding initiative : les moyens pour ajouter de la valeur à un texte numérisé". In : Cursus, vol.1, nº2, printemps 1996. [Internet]. Consulté en juillet 1999 : <http://www.fas.umontreal.ca/EBSI/cursus/vol1no2/beaudry.html>.

retour
BONHOMME, Patrice ; BRUNESEAUX, Florence & ROMARY, Laurent (1996). Codage, documentation et diffusion de ressources textuelles. In : Cahiers GUTenberg, nº24, juin 1996, pp. 177-180.

retour
BURNARD, Lou & SPERBERG-McQUEEN, C.M (1996). "La TEI simplifiée : une introduction au codage des textes électroniques en vue de leur échange", traduction de François ROLE. In : Cahiers GUTenberg, nº24, juin 1996, pp. 23-151.

retour
COVER, Robin (mise à jour july,1999). The SGML/XML Web Page : Text Encoding Initiative (TEI) - XML for TEI LITE. [Internet]. Consulté en septembre 1999 : <http://www.oasis-open.org/cover/tei.html>.

retour
DUCHET, Jean-Louis (1998). "La nécessité d'une norme commune pour la recherche sur corpus : la Text Encoding initiative (TEI) et le langage de balisage SGML". In : Textes, documents et nouveaux médias. Poitiers : Atlantique, 1998, pp. 54-62. Colloque Maison des Sciences de l'Homme et de la Société - Poitiers.

retour
FEKETE, Jean-Daniel (1997). Utilisation de TEI pour coder les documents historiques. [Internet]. Consulté en septembre 1999 : <http://www.emn.fr/fekete/TEI/orleans/>.

retour
GIORDANO, Richard (1995). "The TEI Header and the Documentation of Electronic Texts". In : Computers and the Humanities, vol.29, nº1, 1995, pp. 75-84.

retour
HUDRISIER, Henri (1999). "SGML, HTML, XML : l'ère des machines grammatologiques". In : Passerelles, Numéro spécial Recherche Paris 8, nº 24, 1999, pp. 42-44.

retour
HUDRISIER, Henri (1999). "Distinguer technique de technologie. Un préalable à la réflexion sur les NTIC". In : Passerelles, Numéro spécial NTIC Paris 8, nº24, 1999, pp. 54-57.

retour
IDE, Nancy & VERONIS, Jean (1996). " Présentation de la TEI : Text Encoding Initiative". In : Cahiers GUTenberg, nº24, juin 1996, pp. 4-10.

retour
PLOTKIN, Wendy & SPERBERG-McQUEEN, C.M. Text Encoding Initiative [Page d'accueil de la TEI]. [Internet]. Consulté en septembre 1999 : <http://www.uic.edu/orgs/tei/>.

retour
TEASDALE, Guy (1996). L'Edition savante dans la bibliothèque virtuelle. Publication d'un livre en SGML sur le World Wide Web. Montréal : Université de Montréal, EBSI, 1996. [Internet ]. Consulté en septembre 1999. <http://www.bibl.ulaval.ca/doelec/pul/td-long.html>

retour
TEI : Text Encoding Initiative, numéro spécial, Cahiers GUTenberg, nº24, juin 1996. [Internet]. Consulté en septembre 1999 : <http://www.gutenberg.eu.org/pub/GUTenberg/publications/>.

retour
WILLET, Perry (1996). "The Victorian Women Writers Project : The Library as a Creator and Publisher of Electronic Texts". In : The Public-Access Computer Systems Review, 7, nº6, 1996. [Internet]. Consulté en juillet 1999 : <http://info.lib.uh.edu/pr/v7/n6/will7n6.html>.

Adresse des sites consultés :

retour
American Memory Project. Consulté en septembre 1999 :
<http://lcweb2.loc.gov/ammem/>

retour
Etext University of Virginia. Consulté en septembre 1999 :
<http://etext.virginia.edu/>

retour
Guidelines for Electronic Text Encoding and Interchange (TEI P3). Consulté en septembre 1999 :
<http://www.hti.umich.edu/docs/TEI/>.

retour
INaLF :
<http://www.ciril.fr/INALF/>.

retour
Iresco. Consulté en septembre 1999 :
<http://www.iresco.fr/ressources/sociotextes.html>

retour
Silfide :
<http://www.loria.fr/projets/Silfide/>.

retour
TEI Application Page Project Description (1996, mise à jour juin 1999). Consultation septembre 1999 :
<http://www-tei.uic.edu/orgs/tei/app/index.html>.

retour
TEI Guidelines for Electronic Text Encoding and Interchange (P3). Consulté en septembre 1999 :
<http://etext.virginia.edu/TEI.html>.

retour
UMI :
<http://www.umi.com>.

retour
University of Virginia. Consulté en septembre 1999 :
<http://etext.virginia.edu/TEI.html>.

retour
Victorian Womens Writers Project. Consulté en septembre 1999 :
<http://www.indiana.edu/~letrs/vwwp/index.html>.

retour
Virginia Tech Electronic Theses and Dissertations :
<http://scholar.lib.vt.edu/theses/theses.html>.

retour
Voltaire Foundation. Consulté en septembre 1999 :
<http://www.voltaire.ox.ac.uk/voltaire_french.html>.


© "Solaris", nº 6, Décembre 1999 / Janvier 2000.