Aux sources de la scientométrie
Xavier POLANCO
Ingénieur de Recherche
Direction Groupe Infométrique de l'INIST-CNRS, Nancy
 |
Cet essai se propose à travers l'analyse du travail fondateur de Derek
John de Solla Price (1922-1983), de montrer la constitution de ce champ
intitulé postérieurement scientométrie.
Dans l'introduction, on tâche de cerner le domaine de la
scientométrie dans ses relations avec la bibliométrie et
l'infométrie.
Dans la première partie, on présente d'abord le contexte dans
lequel la scientométrie de Price s'est constituée : un
réductionnisme bibliométrique ; une vision cumulative de la
science ; l'idée d'une science de la science. Ensuite, on analyse les
hypothèses de base et les règles méthodologiques de son
dispositif scientométrique, ainsi que les cinq hypothèses
fondamentales définissant la théorie scientométrique de
Price :
- la loi de croissance exponentielle (qui serait à son avis la
loi fondamentale de toute analyse de la science) ;
- la nature logistique ultime de la croissance scientifique ;
- la forme hyperbolique des distributions bibliométriques (en particulier les lois de Lotka et de la racine carrée de Price) ;
- le modèle fondamental de la distribution d'avantages cumulatifs (DAC) ;
- la théorie sociométrique des collèges invisibles.
Un bilan clôture
cette première partie et soulève le problème d'une
scientométrie cognitive à l'égard de l'approche
externaliste de Price.
La seconde partie expose le modèle bibliométrique de Price. On
voit que dans ce modèle l'analyse des citations vient s'ajouter à
la statistique de la littérature scientifique (exposée dans la
première partie). On analyse la fonction que le modèle de Price
assigne à l'article dans la pratique scientifique. On montre de quelle
manière ce modèle établit la distinction entre
« archive » et « front de recherche » (research
front) dans un domaine scientifique, et il trace une ligne de
démarcation empirique entre la science et les autres formes de
connaissance. On montre également que la technique que Price utilise
pour relever le réseau constitutif de la science (son structure
socio-cognitive), lui permettant de concevoir par ailleurs le projet d'une
cartographie de la science, est l'analyse des citations.
Dans les conclusions,
cet essai propose une nouvelle orientation, ou si l'on préfère,
un changement de paradigme : le projet d'une ingénierie de la
connaissance utilisant des méthodes infométriques.
On entend par modèle une équation ou une structure (quand on ne
travaille pas avec un modèle numérique) destinée à
représenter, d'une manière simplifiée mais consistante, un
processus ou un système. La construction d'un modèle statistique
est destinée à analyser, prévoir ou décider
à partir d'une base rigoureuse et fiable.
|
[Introduction] [Partie 1 : Un modèle statistique de la science] [Partie 2 : un modèle bibliométrique de la science]
Les termes "scientométrie" et "études quantitatives de la science
et de la technologie" seraient des synonymes. D'autre part, il y a un aspect
bibliométrique fort au coeur de ces études quantitatives ou
scientométriques. Parfois, on utilise le terme de "technométrie"
pour signifier l'étude quantitative de la technologie.
En 1962, Price observait que "la mécanique statistique de la
main-d'oeuvre et de la littérature scientifique obéit à
des lois générales", et que "la méthode empirique traitant
le nombre brut de périodiques ou d'articles comme indice du volume de la
science trouve une justification théorique dans l'existence de courbes
stables et régulières" [1].
En
1969, Pritchard définissait la bibliométrie comme "l'application
des mathématiques et des méthodes statistiques aux livres,
articles et autres moyens de communication" [2].
La même année Price
définissait la scientométrie comme "les recherches quantitatives
de toutes les choses concernant la science et auxquelles on peut attacher des
nombres" [3]. Ce sens très large de la
scientométrie s'est restreint à un sens bibliométrique
dans la pratique, si l'on juge par ce qui est publié dans la revue
Scientometrics, c'est-à-dire au calcul des publications
(périodiques, articles, brevets), d'auteurs et de citations [4]. Ce phénomène a
été aidé du fait de l'existence des bases de
données bibliographiques dans le domaine de l'information scientifique
et technique (publications et brevets). L'hypothèse étant que
les publications scientifiques et les brevets constituent une source
d'informations et jouent le rôle d'indicateurs de production de
connaissances certifiées dans les domaines des sciences et des
techniques.
Au début des années quatre-vingt est née en France la
méthode des mots associés (co-word analysis en anglais),
elle représente une autre alternative dans le champ de la
scientométrie [5], à
l'égard du comptage bibliométrique traditionnel et de l'analyse
des citations et des co-citations
La scientométrie désigne, dans son acception large comme il a
été déjà indiquée ci-dessus, l'application
de méthodes statistiques à des données quantitatives
(économiques, humaines, bibliographiques) caractéristiques de
l'état de la science. Ce domaine s'est développé, d'une
part, comme une réponse à une demande provoquée par la
politique de la science et par la gestion (ou management) de la recherche et,
d'autre part, comme le résultat des études de la science
utilisant des techniques statistiques et informatiques de traitement de
données [6].
On a proposé récemment cette définition
compréhensive du domaine :
"Les études quantitatives de la science et de la technologie
représentent le champ de recherche où l'on utilise les
méthodes et les techniques mathématiques, statistiques et de
l'analyse des données en vue de rassembler, manipuler,
interpréter et prévoir une variété de
caractéristiques telles que la performance, le développement et
la dynamique de la science et de la technologie" [7].
On a observé également que les études quantitatives de la
science et de la technologie comportent un volet de recherche appliquée
et un autre de recherche fondamentale. Le premier obéit principalement
à la demande d'indicateurs quantitatifs de la science et de la
technologie pour part de la politique scientifique [8]. Quant au second, on estime que les
méthodes quantitatives et notamment l'analyse des données
constituent un élément indispensable pour l'avancement de notre
compréhension dans l'étude de la science en tant que
système complexe de production et d'échange de connaissances [9].
En outre, le domaine scientométrique (ou des études quantitatives
de la science et de la technologie) présenterait une division technique
interne en trois sous-domaines partiellement recouvrants [10] :
- celui des méthodes et des techniques relatives au
développement des indicateurs visant à mesurer les performances
de la recherche, et lié aux problèmes de la politique
scientifique et du management de la recherche ;
- un autre secteur ayant trait au développement des indicateurs
concernant les performances technologiques, intéressant non seulement
une politique de la technologie mais aussi le management de la R&D ;
- et enfin le sous-domaine des méthodes et des techniques
quantitatives utilisées dans l'étude des processus cognitifs du
développement des domaines scientifiques et techniques, et de
l'interaction entre science et technologie.
Aujourd'hui, le terme infométrie est souvent utilisé pour
désigner l'ensemble d'activités métriques dans le domaine
de la documentation et en particulier de l'information scientifique et
technique (IST) [11].
Pour conclure, voici donc ces trois définitions :
- Bibliométrie : définie en 1969 comme "l'application
des mathématiques et des méthodes statistiques aux livres,
articles et autres moyens de communication" (Pritchard) [12].
- Scientométrie : on peut la considérer comme la
bibliométrie spécialisée au domaine de l'IST. Toutefois,
la scientométrie désigne d'une manière
générale l'application de méthodes statistiques à
des données quantitatives (économiques, humaines,
bibliographiques) caractéristiques de l'état de la science [13].
- Infométrie : terme adopté en 1987 par la F.I.D.
(International Federation of Documentation, IFD) pour
désigner l'ensemble des activités métriques relatives
à l'information, couvrant aussi bien la bibliométrie que la
scientométrie [14].
Dans les pages qui suivent, je montrerai de quelle façon le projet de
Derek John de Solla Price (1922-1983) -- et que j'estime fondateur --
s'appliqua à constituer le domaine de la scientométrie dans le
cadre d'une science de la science.
L'histoire et la sociologie des sciences se retrouvent d'une manière
assez explicite avec l'analyse statistique de la littérature
scientifique (ou scientométrie) dans l'approche de Price. Physicien de
formation, Price se considérait lui-même plus historien des
sciences et des techniques que sociologue. Cependant ses travaux ont eu un plus
grand retentissement parmi les sociologues et les politologues de la science
que parmi les historiens.
Dans un essai sur le problème de la théorie dans la science de
l'information [15], Meadows signale que
l'intérêt pour les caractéristiques quantitatives de
l'information, c'est-à-dire pour une approche de type
bibliométrique, s'est particulièrement développé
à partir des années 1950, sous l'impact du travail de Shannon
(1949), ayant comme fondement les lois bibliométriques de Lotka (1926),
de Bradford (1934) et de Zipf (1935) [16].
Et toujours selon Meadows :
"The key figure in this new quantitatives studies was Price, whose writings,
especially Little Science, Big Science had a major impact on thinking
about the growth and evolution of scientific journals. In part, he drew
together ideas already under discussion. For example, the rapid growth in the
amount of scientific literature had been debated by librarians and others since
the First World War. Similarly, but separately, there had been work on relevant
statistical distributions, such as Lotka's work on scientific productivity and
Zipf's on word distributions. Price extended this earlier work to provide an
integrated, quantitative picture of the scientific literature (...). One
important area of Price's work covered the applications of citation analysis.
In this, he relied on the contemporaneous activities of Garfield in developing
the concept of a citation index" (p. 60).
De son côté, Garfield lui-même a remarqué le rôle
pionnier de Price ; en raison notamment de la convergence dans ses travaux de
l'histoire des sciences, de la scientométrie et de la science de
l'information. Convergence que Price désignera "science de la
science".
Utilisant l'analyse de citations, Garfield a identifié le coeur de
l'oeuvre de Price. Il est constitué par les sept textes plus
cités, en tête et de loin le célèbre Little
Science, Big Science (1963). Ce livre serait donc l'oeuvre de
référence, suivi de l'article "Network of scientific papers"
(1965). Ensuite, vient son ouvrage d'histoire intitulé Science
since Babylon (1961), et puis en ordre décroissant les articles :
"Collaboration in an Invisible College" (1966), "Citation Measures of Hard
Science, Soft Science, Technology, and Nonscience" (1970), "A General Theory of
Bibliometric and other Cumulative Advantage Processes" (1976), et "Measuring
the Size of Science" (1969) [17].
Le travail que je présente ici est une contribution non seulement
à la connaissance de l'oeuvre de Price et pour les raisons qu'on vient
de citer, mais aussi et surtout à la théorie de la
scientométrie.
Dans la première partie, j'analyse les prémisses et les
hypothèses statistiques qui constituent l'architecture théorique
de son modèle statistique de la science. Dans la seconde partie, son
modèle bibliométrique de la science fondé essentiellement
sur l'analyse des citations.
En ce qui me concerne, et pour conclure cette introduction, je tiens à
préciser que je me place intellectuellement et professionnellement dans
l'infométrie en ce qu'elle comporte de synthèse de la
bibliométrie et de la scientométrie, mais aussi comme Brookes l'a
très bien remarqué, en ce qu'elle signifie d'ouverture à
l'étude mathématique de l'information sous ses formes aussi bien
documentaire (science sociale de l'information) qu'électronique ou
physique (science de l'ingénieur ou théorie de la communication
de Shannon), et dans ce sens je suis de ceux qui pensent que la science de
l'information, à être considérée du point de vue de
l'infométrie, relève du domaine des sciences de
l'ingénieur [18].
A l'heure actuelle, s'associant aux recherches en sciences cognitives et en
informatique (notamment en intelligence artificielle), et en linguistique
informatique, l'infométrie peut contribuer au développement d'une
véritable ingénierie de la connaissance objective [19].
-
[1]
- Price, Science et
Suprascience. Traduction française de G. Lévy, Paris,
Fayard, 1972, p. 83. Version original en anglais : Little Science, Big
Science. New York, Columbia University Press, 1963, 118 p.
-
[2]
- A. Pritchard, "Statistical Bibliography or
Bibliometrics?", Journal of Documentation, vol. 25, nº 4, December
1969, p. 348-349.
Pour la préhistoire de cette discipline, voir F.R.
Shapiro, "Origins of Bibliometrics, Citation Indexing, and Citation Analysis:
The Neglected Legal Literature", Journal of the American Society for
Information Science, vol. 43, nº 5, 1992, p. 337-339.
Du
côté francophone, nous pouvons citer Alphonse de Candolle
(1806-1893), Histoire des sciences et des savants depuis deux
siècles (1873), dont la seconde édition de 1885 a
été rééditée par Bruno Latour dans le "Corpus des Oeuvres de Philosophie en Langue
Française" dirigé par Michel Serres. Paris, Fayard, 1987 ;
voir à cet égard A.T. Szabó, "Alphonse de Candolle's early
scientometrics (1883, 1885) with references to recent trends in the field
(1978-1983)", Scientometrics, vol. 8, nº 1-2, 1985, p. 13-33.
-
[3]
- D. de Solla Price, "The Structures of Publication in
Science and Technology", dans H. Gruber et D.G. Marquis (éds.),
Factors in the Transfer of Technology. Cambridge, Mass., The MIT Press,
1969, (p. 91-104), p. 91 :
"quantitatives investigations of all the things
about science to which numbers can be attached", et Price ajoute, "There has
been long tradition of such work, counting papers and measuring man power,
expenditure of money, and several other things, but most recently a better set
of quantitative data than ever before has become available".
Price se
réfère ici à l'analyse des citations à partir des
données fournies par le Science Citation Index de l'ISI.
-
[4]
- Voir R.N. Broadus, "Toward a Definition of
« Bibliometrics », Scientometrics, vol. 12, nº 5-6,
1987, p. 373-379.
-
[5]
- Pour une vision de la scientométrie du point de
vue des auteurs de la méthode des mots associés, voir J-P.
Courtial, Introduction à la scientométrie : de la
bibliométrie à la veille technologique. Paris,
Anthropos-Economica, 1990 ; M. Callon, J-P. Courtial et H. Penan, La
scientométrie. Paris, Presses Universitaires de France, collection
"Que sais-je?", volume nº 2727, 1993.
-
[6]
- A.F.J. van Raan (éd.), Handbook of Quantitative
Studies of Science and Technology. Amsterdam : North Holland, Elsevir
Science Publishers, 1988. Van Raan, "Introduction to the Handbook", p. 1-8.
-
[7]
- Ibid., "Quantitative studies of science and technology
therefore represent the research field of utilisation of mathematical,
statistical, and data-analytical methods and techniques for gathering,
handling, interpreting, and predicting a variety of features of the science and
technology enterprise, such as performance, development, dynamics" (p.
1).
-
[8]
- Ibid., "On the applied side, the demand from
science policy for `objective' data and specific manipulations of data
(`science and technology indicators') is a continuous driving force for the
development of quantitative studies of science and technology " (p. 1).
-
[9]
- Ibid., "On the basic side, science is a
complicated system of knowledge production and knowledge exchange, and the use
of empirical methods in which sophisticated data-collection and data-handling
techniques play a substantial role, is undoubtedly a prerequisite for the
advancement of our understanding " (p. 1).
-
[10]
- Ibid., p.énbsp;1-2.
-
[11]
- Ainsi par exemple, A. Bookstein écrit : "My
impression is that this termes [Bibliometrics] is being replaced in the
literature by Informetrics, a term suggesting a wider range of
applicability, and my usage in this paper is intended to be consistent with
this evolution", voir A. Bookstein, "Informetric Distributions, Part I : Unified
Overview", Journal of the American Society for Information Science, vol.
41, nº 5, 1990, p. 368-375, la note de la p. 368. Un même constat est
fait du côté de l'Inde, voir par exemple I.K. Ravinchandra Rao et
A. Neelameghan, "From Librametry to Informetrics: An Overview and Ranganathan's
Contributions", Libri, vol. 42, nº 3, 1992, p. 242-257.
-
[12]
- Pour suivre l'évolution de ce domaine de recherche dans le
cadre des sciences et technologies de l'information, notamment dans le monde
anglo-américain, voir :
- F. Narin et J.K. Moll, "Bibliometrics",
Annual Review of Information Science and Technology, vol. 12, 1977, p.
35-58 ;
- H.D. White et K.W. McCain, "Bibliometrics", Annual Review of
Information Science and Technology, vol. 24, 1989, p. 119-186 ;
- pour une
vision d'ensemble du domaine de la bibliométrie, voir le numéro
spécial sous la direction de W.G. Potter, intitulé
"Bibliometrics" de la revue Library Trends, vol. 30, nº 1, 1981.
- Voir
également L. Ikpaahindi, "An Overview of Bibliometrics: Its
Measurements, Laws and Theirs Applications", Libri, vol. 35, nº 2,
1985, p. 163-177.
-
[13]
- La référence est ici la revue Scientometrics
fondée en 1978. Pour une introduction à la scientométrie,
on profitera des références signalées ci-dessus dans les
notes 5 et 6. Pour la signification biblio- scientométrique de cet
ouvrage, voir. Il est intéressant de noter que L. Egghe,
"Methodological Aspects of Bibliometrics", Library Science, vol. 25,
nº 3, 1988, p. 179-191, réduit la scientométrie à
l'analyse des citations.
-
[14]
- L. Egghe et R. Rousseau, Introduction to Informetrics.
Amsterdam, Elsevier, 1990.
L. Egghe et R. Rousseau, éds.,
Informetrics 87/88. Amsterdam, Elsevier, 1988, p. IV ;
dans ce
même ouvrage, voir la référence de B. C. Brookes dans son
article "Comments on the Scope of Bibliometrics", p. 29 ;
ici Brookes note
justement : "A third term informetrics has recently been adopted by F.I.D. but,
as far as I can see, it is been used to cover both sciento- and biblio- metrics
impartially. It has produced no distinctively new ideas of its own but as it
implicitly covers both documentary and electronic forms of information, it may
have a future". Il est intéressant de remarquer que du point de vue de
Brookes, l'infometrie couvre indistinctement dans son domaine de recherche la
théorie mathématique de l'information bibliographique ou
documentaire (bibliométrie traditionnelle), et la théorie
mathématique de l'information electronique c'est-à-dire la
théorie de l'information de Shannon.
-
[15]
- A.J. Meadows, "Theory in information science",
Journal of Information Science, vol. 16, nº 1, 1990, p. 59-63.
-
[16]
- Pour la source originale de ces lois, voir :
- A.J. Lotka,
"The frequency distribution of scientific productivity", Journal of the
Washington Academy of Sciences, vol. 16, nº 12, 1926, p. 317-323 ;
- S.C.
Bradford, "Sources of information on specific subjects", Engineering,
vol. 137, nº 3550, 1934, p. 85-86 ;
- G.K. Zipf, The psycho-biology of
language. Boston, Houghton, 1935,
- et également Human behaviour
and the principle of least effort. Cambridge, Mass., Addison-Wesley,
1949.
-
[17]
- E. Garfield, "In Tribute to Derek John de Solla Price:
A Citation Analysis of Little Science, Big Science", Scientometrics,
vol. 7, nº 3-6, 1985, p. 487-503.
-
[18]
- La conséquence institutionnelle de cette
position est que la science de l'information est à déplacer dans
les écoles d'ingénieurs et les facultés des sciences,
comme l'informatique, c'est-à-dire comme une branche des sciences de
l'ingénieur. Par ailleurs, le philosophe des sciences Karl Popper dans
son essai Misère de l'historicisme (1944), traduit de l'anglais
par H. Rousseau (Paris, Librairie Plon, 1957), disait avec raison qu'il fallait
développer en sciences sociales ce qu'il appellait une ingénierie
sociale, c'est-à-dire "une méthode dont le but serait une science
sociale technologique" (p. 47). Ceci est applicable au domaine des sciences
sociales de l'information.
-
[19]
- Ce projet est implicite dans X. Polanco et al.,
"L'infométrie, un programme de recherche", Journées
d'études "Les systèmes d'information élaborée",
organisées par la Société Française de
Bibliométrie Appliquée, Ile Rousse, Corse, 9-11 juin 1993.
Cette
position est explicitement exprimée dans mon texte intitulé
"L'infométrie mode d'emploi", à paraître dans une
publication de l'Université Catholique de Louvain (Belgique).
[Introduction] [Partie 1 : Un modèle statistique de la science] [Partie 2 : un modèle bibliométrique de la science]
© "Les sciences de l'information : bibliométrie, scientométrie, infométrie". In Solaris, nº 2, Presses Universitaires de Rennes, 1995
