La science ouverte, d’initiatives communautaires à politique publique MOOC science ouverte, Lionel Maurel - Entretien complet

D’après un média publié le 27/10/2022 Source Avertissement

Type de publication Vidéo

Politiques publiques de science ouverte

Je dirais qu’à la base, la science ouverte, ou ce qu’on appelait plutôt à l’époque « libre accès » ou open access, s’est créée comme un mouvement qui est venu des chercheurs eux-mêmes. Ça a d’abord été une initiative auto-organisée et ça l’est resté pendant longtemps. Une initiative d’abord portée par les chercheurs eux-mêmes qui trouvaient des moyens ; par exemple Arxiv [1], en mathématique ou en physique, est née de ces initiatives auto-organisées. Les établissements ont mis un certain temps à rejoindre la dynamique et, pendant longtemps, on était vraiment sur une logique d’établissements qui était appelés à prendre des déclarations, des engagements, université par université ou organisme de recherche par organisme de recherche. C’est une phase qui a duré pendant un certain temps et qui a donné lieu à des initiatives variées qui pouvaient être plus ou moins avancées.

Ce qui est significatif depuis quelques années, et je le dirais comme ça, la science ouverte est devenue une politique publique en tant que telle. C’est-à-dire que la grosse différence c’est que maintenant on a une impulsion qui est partie de l’Union européenne. L’Appel d’Amsterdam [2],en 2016 si je me souviens bien, a appelé les États à prendre des initiatives. La France a été l’un des pays qui a répondu le plus fortement et ça nous a donné le Plan national pour la science ouverte [3], en 2018, et, pour moi, ça nous fait rentrer dans une nouvelle phase où la science ouverte devient une politique publique en tant que telle. Du coup ça change la donne, parce qu’on n’est plus dans un mouvement où les chercheurs ou les établissements peuvent rejoindre la dynamique, ou pas. On est dans une politique publique, avec ce que ça comporte de systématisation de la démarche et d’incidence sur les financements, sur les évaluations et d’autres leviers qui sont, à mon sens, autrement plus puissants pour essayer d’atteindre la phase suivante.

Rapport de force entre institutions publiques et éditeurs commerciaux

Nous sommes partis d’une situation où nous étions dans un pur rapport de force, au sens où il n’y avait pas de leviers, au sens juridique du terme, qui étaient actionnables face aux éditeurs. On avait cette phase critique de la cession des droits par les chercheurs, qui entraîne un transfert des droits à l’éditeur. Il y avait très peu de moyens, en fait, de négocier face aux éditeurs, surtout que, pendant longtemps, la dynamique a reposé sur l’engagement du chercheur individuel. C’était le chercheur seul, face à l’éditeur, qui devait, qui, plutôt, était supposé négocier les termes de son contrat. On sait que, évidemment, l’auteur isolé n’est pas du tout dans une position qui lui permet d’obtenir des avancées significatives.

Ensuite on a eu une phase de rapports de force, on pourrait dire quasi syndicales, c’est-à-dire que les chercheurs se coalisaient ensemble, toujours plus ou moins à titre individuel, pour faire des boycotts. On avait eu les fameux appels au boycott, The cost of knowledge, qui avaient été lancé à partir de certaines communautés comme les mathématiques, qui demandaient qu’on boycotte un éditeur comme Elsevier [4]. On voit que ça a eu des effets, je pense, mais pas non plus significatifs.

Ensuite on est passé dans une phase où le levier actionné était celui de la négociation et de la structuration des négociations. Toute la logique des consortiums d’achat, des consortiums souvent menés par les bibliothécaires et les bibliothèques qui entendaient porter la négociation à une échelle supérieure, notamment à une échelle nationale à travers le mécanisme dit de « licence nationale », pour, là aussi, essayer d’avoir un rapport de force construit sur la puissance de négociation. Alors là, oui, il y a eu des avancées. On a pu, par moments, obtenir notamment des baisses de prix, des accords plus favorables au niveau des conditions sur ce qu’on peut faire des contenus, développer des pratiques comme la fouille de données. Il a eu des avancées qu’on ne peut pas nier. Je ne pense pas qu’on puisse dire que ça a permis de modifier significativement le rapport de force, parce que, au moins pour les grands éditeurs internationaux, on a une situation de quasi-monopole qui est extrêmement difficile à défaire, même en se coalisant pour les négociations.

Le troisième levier qui est mis aujourd’hui en œuvre, depuis le milieu des années 2010, c’est le levier strictement juridique, c’est-à-dire que la loi a fini par rentrer dans l’équation, notamment la loi pour une République numérique [5], en 2016, qui donne un droit, on va dire incessible, aux chercheurs de faire des dépôts en archive ouverte. Ce qui est un élément aussi très fort de rééquilibrage, en gros, ce moment critique de la cession des droits à l’éditeur a été très limité dans sa portée, mais, là aussi, ça ne suffit pas : il faut que l’exercice du droit devienne maintenant effectif. C’est-à-dire que ça ne peut jouer un rôle dans le rééquilibrage du rapport de force que si les chercheurs utilisent systématiquement cette faculté. Et on voit que certains établissements commencent à changer leur politique pour que les chercheurs en fassent un usage systématique.

À côté de ça on a quand même, aujourd’hui, une persistance de la logique de négociation à travers ce qu’on appelle les « accords transformants », qui sont de nouvelles formes de négociation qui ont été proposées à certains éditeurs pour obtenir, par le biais de la négociation, des transformations très rapides et avec des effets puissants pour le libre accès.

Je dirais qu’actuellement le rapport de force est sur ces deux plans : la voie juridique et la voie de ce renouvellement des formes de négociation.

Un autre élément qui peut jouer dans le rééquilibrage du rapport de force, c’est carrément la question du désabonnement qui a pu être mis en œuvre par le passé. C’est un peu la stratégie du boycott dont je parlais tout à l’heure, mais porté au niveau collectif et au niveau des négociations. On a eu récemment le désabonnement de Springer [6] en France, certains établissements ont choisi de ne pas se réabonner parce que l’offre ne leur paraissait pas satisfaisante. C’est un élément qui peut jouer, mais je pense qu’il reste encore relativement marginal : quand on regarde le panel des négociations, il y a finalement assez peu de désabonnements, en tout cas pour les éditeurs les plus significatifs. Il ne faut pas non plus occulter qu’il puisse y avoir une pression des chercheurs eux-mêmes pour maintenir ces abonnements et ne pas se couper de certains accès. C’est donc une stratégie qui est difficile à mettre en œuvre, je pense, pour les établissements.

Un autre élément qui, peut-être, finira par jouer aussi dans la balance, c’est tout simplement la proportion des contenus qui sont en libre accès, notamment dans les archives ouvertes. Mais là, il faudra sûrement attendre que la démarche de dépôt en archive ouverte soit systématisée pour qu’on puisse vraiment voir un effet. Actuellement ça dépend des disciplines, mais, à mon avis, globalement on n’a pas une proportion qui permette de peser significativement encore dans la balance. On pourra revoir, dans quelques années, quand les politiques d’établissement auront produit leurs effets.

Les accords transformants

Les accords transformants, c’est un sujet relativement complexe parce que c’est une dénomination qui peut recouvrir beaucoup de choses. Très rapidement, ce sont des nouvelles formes de négociation qui ont été proposées à certains éditeurs, qui, en gros, envisagent, à coût constant ou à coût maîtrisé, de provoquer un changement radical de la philosophie, c’est-à-dire de transformer, en fait, les coûts d’abonnement en une sorte de forfait global qui permette progressivement d’aboutir au basculement des contenus en libre accès. De nombreuses formules existent dans le monde ou sont en cours de négociation. Certains y voient un espoir, en tout cas pour les contenus liés aux gros éditeurs, d’arriver rapidement à une modification du paysage.

À titre personnel, je suis extrêmement dubitatif sur ces types de négociation. Je pense, en fait, que le terme « transformant » est très mal employé parce que, oui, on aurait une transformation au sens où les contenus arriveraient en libre accès, mais on n’aurait pas une transformation profonde du paysage. Ces accords conservent la position prédominante des grands acteurs du monde de l’édition au niveau mondial, ils laissent les contenus entre leurs mains et, notamment, ils ne changent pas la propriété des titres, c’est-à-dire que les grands journaux restent la propriété de ces grands éditeurs, notamment les marques que ces grands journaux peuvent avoir sur les titres. Ensuite, ce ne sont pas des accords qui modifient significativement le rapport de force en termes financiers, parce que ça reste à coût constant ou à coût maîtrisé d’ailleurs sans nous donner de garanties réelles sur la maîtrise des coûts. Ces accords, quand on les regarde dans le détail, ne nous disent pas que les coûts ne finiraient pas par réaugmenter d’une manière ou d’une autre.

Moi, je le vois comme une sorte de deus ex machina, qui est présenté comme tel, comme une personne qui pense pouvoir aller vite alors que pour moi, l’open access n’est pas quelque chose sur lequel on puisse aller si vite que ça. Ça nécessite une transformation en profondeur du paysage et, à terme, la science ouverte implique une réappropriation par la communauté scientifique de ses moyens de diffusion des résultats. Cela nécessite un travail lent et minutieux et peut-être même que les accords transformants nous éloignent de ce but, parce qu’une fois qu’ils seront signés, ces journaux deviendront la voie royale, en fait, pour aboutir très rapidement à l’open access et l’effort patient, long, difficile, de réinvestissement des moyens dans la réappropriation, notamment des fonctions éditoriales, sera peut-être découragé par ce type d’accord. Donc, j’avoue que je suis assez dubitatif sur ce point.

Édition publique en sciences humaines et sociales

Je travaille essentiellement dans le champ des sciences humaines et sociales et en France on a l’exemple, en fait, d’une plateforme comme OpenEdition [7] qui, depuis maintenant 20 ans, a mis en place un système de publication tout à fait solide, crédible et très utilisé par les sciences humaines et sociales, avec un modèle d’open access qu’on appelle « diamant » [8]. C’est un modèle où ni le lecteur, ni l’auteur, le chercheur ne paient. Les financements sont en grande partie assurés par la puissance publique et, marginalement, par des services commerciaux que ces plateformes offrent, mais pas sur le contenu lui-même, sur des services à valeur ajoutée. C’est un exemple qui a le mérite de montrer que c’est possible. C’est possible. Par contre, ça demande une vraie volonté politique pour développer ce type de plateforme. Openedition, c’est 20 ans d’investissement patient et méthodique, notamment en termes de ressources humaines, c’est un service qui demande beaucoup de ressources humaines.

La question est de savoir si les pouvoirs publics sont prêts à faire ce type d’investissement. On peut penser que c’est à l’échelle de l’Union européenne, en fait, qu’il faudrait que le relais soit pris aujourd’hui. Il faut peut-être qu’on sorte de cette logique nationale si on veut avoir des moyens significatifs de raisonner au niveau mondial. C’est peut-être à l’échelle de l’Union européenne qu’il faudrait créer ce type de plateforme. Et, pour moi, ça pose vraiment la question, justement, de savoir comment on dégage ces moyens. Il faut bien voir que tant que les ressources sont absorbées par les abonnements, y compris d’ailleurs si les ressources basculent sur des accords transformants, ça laisse très peu de marge de manœuvre pour faire ces investissements-là. C’est possible et, à mon avis, c’est même souhaitable. Je pense que l’objectif devrait être de reconstruire un système de publication soutenu par l’acteur public, mais ça nécessite un choix politique vraiment significatif de la part des pouvoirs publics.

On voit par exemple, dans le Plan national pour la science ouverte [3], qu’il y a un vrai souci pour les infrastructures, au-delà des plateformes d’édition. La science ouverte doit reposer sur des infrastructures contrôlables et contrôlées, c’est-à-dire maîtrisées et ça, ça passe par des structures publiques. Il faut absolument pouvoir se reposer sur des choses qui ne sont pas rachetables et pour lesquelles on ait une vue à long terme sur la pérennité.

Dans le Plan national pour la science ouverte, il y a une vraie attention là-dessus. On a vu, dans le premier appel du Fonds national pour la science ouverte [9], qu’il y a eu un volet infrastructures, je dirais donc que la problématique est identifiée. Maintenant, le choix politique est clairement encore devant nous, parce qu’une des faiblesses du Plan national pour la science ouverte, c’est son financement : des financements ont été annoncés, mais ils ne sont pas tout à fait à la hauteur, je pense, de l’ambition qui est poursuivie. Le financement actuel du Plan national pour la science ouverte n’est même pas l’équivalent de ce que paye une université aux grands acteurs de l’édition pour s’abonner. Donc, il y a encore des choix, en termes, de financement qui restent devant nous.

En sciences humaines et sociales, on a un tissu éditorial qui est assez particulier parce qu’il est beaucoup moins internationalisé et on n’a pas cet effet de concentration quasi monopolistique dans quelques acteurs ; il y a une répartition qui est beaucoup plus grande et un poids de l’édition publique qui est aussi encore beaucoup plus fort. Pendant longtemps on a dit que c’était un désavantage, notamment parce que ça nuit, d’une certaine manière, au rayonnement international de ces sciences-là, mais pour aborder le virage de la science ouverte, c’est un atout, parce que c’est un paysage sur lequel on a beaucoup plus la maîtrise.

Il y a la question des petites maisons d’édition privées qui sont plus sensibles à ces effets-là. Par exemple, pendant la négociation de la loi pour une République numérique, en 2016, on a peu entendu Elsevier ou Springer se manifester dans le débat public. C’étaient surtout des petites maisons d’édition privées françaises, petites ou moyennes, qui étaient opposées à la loi pour une République numérique.

Ce qu’il faut bien voir, c’est que la transition a maintenant quelque chose d’un peu inéluctable. Il faut que ces acteurs comprennent qu’un modèle économique basé uniquement sur une barrière payante n’est pas soutenable à long terme, à mon avis, et ils doivent changer de modèle. On a un certain nombre d’acteurs publics et privés, des maisons d’édition, qui ont déjà rejoint, par exemple, Openedition, qui passent par ce canal-là, à travers, notamment, le système du freemium
[10], pour bénéficier des revenus que la plateforme Openedition arrive à dégager. Ça prouve qu’il y a des moyens de combiner les deux.
Je pense aussi qu’inéluctablement le mouvement vers la science ouverte appelle une prise de position plus importante de l’édition publique, notamment en sciences humaines et sociales. C’est-à-dire que les Presses Universitaires doivent retrouver une place qu’elles ont, sans doute, plus ou moins perdue au fil du temps.

On a un système dans lequel l’éditeur a finalement fini par oublier qu’il a un service à rendre qui doit être effectif. Il y a beaucoup d’éditeurs, en fait, qui vivent du transfert des droits et la question du service est passée au second plan. Maintenant, une maison d’édition privée doit faire significativement valoir qu’il y a un service à valeur ajoutée qui est fait et que c’est ce service qu’on paye, pas l’exploitation des droits mais le service rendu. Et là, je pense que l’édition privée, à ce titre-là, comme, finalement, un imprimeur à qui on paye un service, peut continuer à jouer son rôle. Mais penser qu’on peut continuer à faire de l’édition uniquement en exploitant des droits, dans le contexte de la science ouverte, c’est, à mon avis, une impasse pour le privé.

En sciences humaines et sociales, on est effectivement dans une tradition, en tout cas en France, où les chercheurs continuent à animer eux-mêmes les comités éditoriaux. On a aussi des situations où une grande part du travail éditorial lui-même est fait par des agents publics, y compris quand les revues sont publiées ensuite par des éditeurs privés. Donc, du coup, il y a effectivement aussi beaucoup de sociétés savantes qui sont encore détentrices des droits sur les revues, même quand elles font affaire ensuite avec un éditeur, elles ont gardé la propriété des titres. Du coup, effectivement, je pense que la maîtrise du paysage est quand même plus ancrée dans les communautés scientifiques elles-mêmes. On n’a pas ces dispositifs comme en sciences dures où l’auteur fait lui-même quasiment le travail d’édition à travers un masque de saisie sur la plateforme de l’éditeur et, finalement, transfère le fichier avec un travail éditorial qui est fait aussi, en partie, par l’auteur. En sciences humaines et sociales, la question de la qualité du travail éditorial, de la mise en page, des images, tout ça a une part souvent assez significative et reste en grande partie effectuée soit par les chercheurs soit par des structures d’édition publique.

Ouverture des données de la recherche

La loi pour une République numérique est connue pour son effet sur les publications, mais elle est beaucoup moins connue pour son effet sur les données. Or, à mon avis, elle a eu, en tout cas juridiquement, un effet même plus puissant pour les données que pour les publications, au sens où elle a créé, en fait, un principe d’ouverture par défaut des informations publiques. C’est-à-dire que normalement, une administration, dans le cadre de sa mission de service public, est tenue de publier spontanément en ligne les informations qu’elle produit et de les rendre librement réutilisables. C’est un principe qui connaît des exceptions légitimes — protéger les données personnelles, respecter les droits d’auteur, respecter les secrets administratifs —, mais l’état de la loi est assez clair. Et la loi pour une République numérique a intégré les données de recherche comme étant des données publiques, ce qui n’était pas nécessairement évident comme choix ; c’est le choix qui a été fait par le législateur.

On constate maintenant, après quatre ans d’application de la loi, que les effets sont contrastés. Le principe existe, mais la réalité est encore très loin de correspondre à ce que la loi nous dit.

Ce qu’il faut voir d’abord, c’est que cette limite de l’effet de la loi pour une République numérique n’est pas présent que pour la recherche. C’est-à-dire que les collectivités territoriales, par exemple, les ministères, les établissements publics sont aussi tenus de faire de l’open data par défaut, et les premiers audits ont montré qu’il y avait un retard assez considérable. Donc la recherche n’est pas particulièrement à blâmer, je pense, dans ce décalage.

Pourquoi y a-t-il une sorte de difficulté, pour la loi, à passer dans les faits ? Déjà, tout simplement, je pense que peu d’acteurs savent, y compris, d’ailleurs, dans les instances décisionnaires des établissements d’enseignement supérieur et de recherche, que cette loi existe et qu’elle a ces effets-là. je pense qu’l y a eu un problème, à un moment donné, de communication et d’explication de ce que signifie vraiment la loi.

Ensuite il y a une vraie question de réorganisation des établissements, d’ailleurs on le voit dans les établissements publics en dehors de la recherche. Ouvrir les données oblige à ce que les données deviennent un enjeu significatif dans la structure, que la structure se préoccupe de ses données, sache les données qu’elle possède, fasse des analyses sur l’état des données, soit capable, ensuite, de définir tout un protocole qui permette d’assurer la mise en ligne et l’ouverture. Donc ça oblige à faire des réorganisations, ça demande des moyens humains et je pense que ça demande, aussi, une volonté d’établissement. On ne peut pas compter sur la volonté individuelle des chercheurs d’ouvrir les données, si tant est que cette volonté existe, pour avoir un résultat ; ça doit être une logique d’établissement.

On commence à voir des établissements qui prennent des chartes de science ouverte avec des volets sur les données. Et là, j’imagine qu’on va entrer dans une phase où il y aura des actions institutionnelles qui vont se mettre en place, mais nous n’y sommes pas tout à fait encore. Il faut voir aussi que le paysage, je dirais des infrastructures, n’est pas encore tout à fait structuré, en tout cas pas du tout de la même manière que pour les publications. On n’a pas l’équivalent d’un HAL [11], par exemple, pour les données. On n’a pas de cheminement naturel et bien balisé qui nous permettrait de savoir comment publier les données et où. Ça aussi, à mon avis, c’est un enjeu : le jour où on aura des infrastructures bien balisées, il sera beaucoup plus simple d’appliquer le principe d’ouverture par défaut.

Un des intérêts souvent mis en avant d’ouvrir les contenus c’est de favoriser les usages extra-académiques dans une logique de science citoyenne, de participation du public à la science. Dans des usages extra-académiques on peut penser aussi aux réutilisations par les entreprises, qui sont parfois mises en avant pour justifier, en tout cas mettre en avant l’intérêt des politiques d’ouverture des données. Globalement, j’ai l’impression que ça reste quand même assez marginal.
Aujourd’hui, il faut dire que l’ouverture des données de recherche en elle-même est assez limitée en fait. Les réutilisations académiques sont encore assez assez limitées, donc les réutilisations extra-académiques le sont encore plus. À mon avis, il faudrait déjà attendre qu’une masse significative de données de recherche soit ouverte pour vraiment pouvoir parler de réutilisation de ces données-là par la société civile, par des associations.

Ceci étant dit, on a déjà quelques exemples. J’ai en tête des exemples dans le champ de la botanique où on a des associations actives. Une association qui s’appelle Tela Botanica [12] produit des données et réutilise des données aussi de recherche ; elle montre qu’on peut avoir des synergies entre des initiatives portées par la société civile etc. Je pense qu’on soupçonne encore mal, justement, les réutilisations possibles par la société civile, tout simplement parce qu’il n’y a pas assez de données de recherche qui sont réellement ouvertes, au sens fort du terme.

La question des infrastructures pour le stockage et la diffusion des données est un sujet complexe. Je ne pense pas qu’on puisse raisonner en matière de données exactement comme on l’a fait pour les publications. Les publications sont quand même des objets qui sont relativement standardisés, même si on a de la diversité aussi dans les publications, mais j’ai quand même l’impression que c’est relativement standardisé, alors que le terme « données », qui est un peu trompeur, peut renvoyer à des objets qui sont d’une variété sans fin : une donnée de recherche peut aussi bien être des chiffres, des mesures quantitatives, des statistiques, des images, des enregistrements sonores, des données d’enquêtes, ça peut être mille et une choses ; j’ai déjà vu des archéologues qui considèrent que les tessons de poterie qu’ils retrouvent sur le terrain sont des données de recherche. Donc c’est difficile, pour moi, d’imaginer qu’on puisse refaire notamment ce qu’on a fait avec HAL pour les publications. Je vois mal, en fait, UNE infrastructure qui finirait par être l’entrepôt de référence au niveau national.

Donc, actuellement, on a une situation qui ressemble un peu à celle qu’on a connue il y a quelques années sur les archives ouvertes, où les établissements, certains en tout cas, montent un entrepôt institutionnel. On a des entrepôts qui sont plus disciplinaires, qui peuvent être au niveau national ou international. En sciences humaines et sociales on a Huma-Num [13], par exemple, qui fait ça. On a des initiatives privées et on a des éditeurs privés aussi, qui mettent en place des entrepôts.
Je pense qu’il y a vraiment un enjeu très fort à avoir des infrastructures publiques, mais savoir s’il faut que ces infrastructures seront le plus appropriées au niveau local, au niveau national, au niveau disciplinaire, c’est une question qui est encore devant nous et, à mon avis, il faut laisser un peu de temps aussi à la structuration, on va dire un peu naturelle du paysage, avant de prendre des grandes décisions top-down sur le sujet.

Il est vrai, quelque part, que la France est un des pays qui a le plus avancé sur ces questions d’ouverture des données depuis la loi de 2016. Savoir si une forme de réciprocité sur l’accès et la réutilisation de données va se mettre en place est une question qui peut se poser au niveau international. Déjà normalement, l’année prochaine ou dans les années à venir, on a une transposition de la directive européenne, une nouvelle directive sur les informations du secteur public qui devrait harmoniser les conditions d’ouverture et de réutilisation au niveau de l’Union européenne. On peut penser que tous les pays européens auront plus ou moins le même cadre que le cadre français ; ça nous garantira déjà, au niveau de l’Europe, une certaine forme de réciprocité.

Au niveau international, on commence à voir, par exemple, l’Unesco qui est en train de préparer une déclaration sur la science ouverte qui pourrait conduire, en fait, à un traité ; quand on lit la déclaration, c’est un peu ce qui est sous-entendu. Ce serait effectivement extrêmement intéressant, mais je pense que c’est un processus qui risque d’être très long. Donc, on risque de se trouver dans une situation où il n’y aura pas nécessairement de réciprocité automatique avec des pays comme les États-Unis ou la Chine. J’ai tendance à penser que cette question n’en est peut-être pas une, parce que les études qu’on a montrent, par exemple, qu’une publication est plus citée si les données liées à la publication sont accessibles, même significativement plus citée ; que les effets en termes de rayonnement, en termes de visibilité et en termes de collaboration seront supérieurs aux effets de passager clandestin, on parle toujours de pillage des données, qui pourrait réutiliser les données. Dans le monde scientifique, théoriquement, on ne peut pas réutiliser des données sans citer leur origine, sinon il y a un problème de méthodologie scientifique et j’ai l’impression que cette citation des données garantit en elle-même beaucoup de choses.

J’ai donc l’impression qu’il ne faut pas trop s’inquiéter des risques de non-réciprocité. Par contre, à mon avis, un enjeu stratégique — et je pense qu’on en est loin en France — est qu’il faut absolument apprendre à nos chercheurs à réutiliser des données, parce qu’on est encore dans une logique où le chercheur produit des données lui-même, les exploite, publie sur les données qu’il a produites. Il y a encore très peu, je trouve, de formation à la réutilisation des données. Les communautés scientifiques qui deviendront, à mon avis, les plus habiles et les plus à même de réutiliser des données, de savoir les identifier et de savoir les mettre en valeur, auront un avantage demain. Donc former à la réutilisation des données me paraît un enjeu très important.

Licences, cession et protection du droit d’auteur

La question des licences est importante et on pourrait dire qu’elle a longtemps été perdue de vue. Si on relit les grandes déclarations sur l’open access, Budapest, Berlin, on voit que les rédacteurs originels, qui ont conceptualisé l’open access, n’en faisaient pas qu’une question d’accès. Ils avaient tout à fait conscience que la logique de l’open access impliquait aussi une possibilité de réutiliser les contenus, donc ils avaient intrinsèquement lié, à la base, l’open access à cette question de la libre réutilisation. Et en cours de route, peut-être parce que le terme open access n’était finalement pas celui qui était le plus approprié — moi je suis tout à fait content qu’on parle maintenant de science ouverte plutôt que d’open access, parce que ça dissipe ce malentendu — on a oublié l’enjeu des licences. Pendant très longtemps, par exemple dans HAL, on ne pouvait pas choisir de licence sur les contenus, on ne pouvait pas choisir une licence Creative Commons [14]. Ce n’est que dans sa troisième version, je crois, que HAL a donné la possibilité aux chercheurs de choisir une licence Creative Commons.

Cet enjeu est en train de changer, il revient sur le devant de la scène à travers la question des données, parce que l’ouverture des données implique la réutilisation : on ne peut pas faire de l’ouverture des données si on se contente de mettre les données accessibles en ligne sur Internet. Le concept même d’open data, qui est celui qui a, on va dire, configuré la question de l’ouverture des données, implique intrinsèquement la réutilisation. Donc va se poser la question de savoir quelles sont les licences qu’on peut choisir. On a tout un ensemble de choix possibles. En France, on a un décret d’application de la loi pour une République numérique qui liste les licences qui peuvent être utilisées et qui recommande d’utiliser notamment la Licence Ouverte [15] qui a été faite par la France pour encadrer son processus d’ouverture des données, une licence qui permet la réutilisation des données à toutes fins, avec pour seule limite de citer la source et de ne pas dénaturer les données.

On a aussi une autre licence qui s’appelle l’ODbL, Open Database License [16], une licence très inspirée des licences de logiciel libre, qui permet la réutilisation à condition de repartager les données à l’identique en cas d’enrichissement ou de modification.

On a donc ces choix-là et on a aussi, dans le paysage, les licences Creative Commons qui sont des licences qui existent depuis maintenant plus d’une vingtaine d’années et qui offrent des options pour permettre d’indiquer les restrictions qu’on souhaite laisser à la réutilisation. Dans le cadre de la loi française, les seules licences qui sont compatibles avec l’esprit de la loi française, sont :

la licence CC BY : réutilisation possible à toutes fins, à condition de citer la source ;
la licence CC BY SA, SA veut dire share alike, partage à l’identique. C’est l’équivalent de la licence ODbL que je citais tout à l’heure : on peut réutiliser à toutes fins, à condition de repartager sous la même licence tous les enrichissements qu’on aurait faits sur les données qu’on a récupérées ;
et il y a une licence qui s’appelle CCO, qui lève toutes les restrictions à la réutilisation, y compris la mention de la source.

Voilà, en gros, le paysage des licences. Je terminerai en disant qu’un autre élément qui va remettre un gros coup d’actualité sur les licences, c’est la mise en œuvre du Plan S [17], qui porte sur les publications, mais qui demande à ce que les publications financées par des agences type ANR [18] soient obligatoirement placées sous la licence CC BY, ce qui est une sorte de retour aux sources, en fait, de l’open access tel qu’il était dans la déclaration de Berlin ou de Budapest.

L’accent qui est mis par le Plan S sur les licences type CC BY est, à mon sens, un tournant vraiment décisif dans le rééquilibrage du rapport de force avec les éditeurs. Pourquoi ? Depuis le début, le problème, c’est la question de la cession des droits. C’est-à-dire que, en gros, l’éditeur ne peut s’appuyer que sur les droits de l’auteur pour capter la propriété intellectuelle sur les contenus. Ce moment-là est critique, parce que l’auteur possède, à la base, ses droits, mais par la cession, il peut s’en déposséder et toute la question de l’open access est conditionnée par ça ; c’est ce moment critique qui entraîne tout le reste. La stratégie de la coalition S est intéressante, parce que l’objectif était d’arriver à un open access immédiat et on sait qu’actuellement on n’a pas le cadre législatif qui nous permet d’arriver à cet objectif, c’est-à-dire que la loi pour une République numérique continue à ménager des délais que les éditeurs peuvent continuer à revendiquer : un délai de six mois pour les sciences et techniques et de douze mois pour les sciences humaines et sociales. Comment faire sans toucher la loi pour arriver à un open access immédiat ? Et là, la coalition S a imaginé que l’auteur fournisse à l’éditeur son manuscrit déjà placé sous une licence Creative Commons CC BY. Je trouve que c’est extrêmement habile parce que, quelque part, ça nous montre à quel point l’ouverture protège, ce qui est très contre-intuitif. On a l’impression qu’ouvrir les contenus est quelque chose qui va vous menacer, mais en fait non : si vous abandonnez ce droit patrimonial, ce que fait la licence CC BY, vous renoncez à exercer ce droit patrimonial et ensuite l’éditeur n’a plus rien à capter.

C’est une stratégie à la Gandhi, on pourrait dire de non-violence juridique, c’est-à-dire que je renonce à garder mes droits de sorte qu’il n’y ait plus rien à capter. Du coup, les éditeurs vont se retrouver dans le choix soit de refuser ces manuscrits, mais s’ils les acceptent, ils ne pourront plus s’opposer à l’open access immédiat. Il sera très intéressant de voir ce que va donner l’entrée en vigueur du Plan S.

La recherche scientifique comme bien commun

Est-ce que la recherche scientifique constitue un bien commun ? C’est une phrase qui figure dans le Plan national pour la science ouverte, il est dit que l’objectif c’est de faire des résultats de la recherche un bien commun de l’humanité. C’est une question qui est assez complexe parce que savoir ce qu’est un bien commun en soi peut être discuté, on a plusieurs écoles de définition. À mon sens, c’est quelque chose qu’il faut voir au sens large. Quand on dit « la science est un bien commun », on se concentre souvent uniquement sur les résultats de la recherche, les publications, les données, qui seraient des biens communs au sens où on voudrait qu’ils soient le plus largement partagés et réutilisés. Mais, pour moi, la recherche relève du champ des communs dans un sens bien plus profond, en fait. Quand on regarde les communautés de recherche, elles ont, en grande partie à cause du statut des chercheurs, une réelle capacité d’auto-organisation. C’est ça, en fait, qui fait surtout, pour moi, le rattachement à la question des communs. C’est-à-dire que les communautés scientifiques, et ça vaut aussi bien à l’échelle d’un laboratoire qu’au niveau national ou international, ont une réelle capacité d’auto-organisation qui tient à la protection de la liberté académique et au fait que les chercheurs ne sont pas soumis notamment à des obligations de respect du pouvoir hiérarchique comme peuvent l’être des agents publics normaux. Ce statut protecteur leur donne une capacité d’auto-organisation, donc ce ne sont pas seulement les résultats de la recherche qui sont un bien commun, c’est le fonctionnement même de la communauté scientifique qui, par ce pouvoir d’auto-organisation, relève, à mon sens, d’une certaine forme de logique de communs de production de connaissances.

Je pense que, dans la logique de la science ouverte, il faut absolument garder ça en tête. Si on a des politiques publiques de science ouverte, il faut toujours qu’elles gardent à l’esprit qu’il faut aussi préserver cette capacité d’auto-organisation des comités de recherche. Il ne faut pas déterminer l’ensemble des politiques publiques d’en haut, il faut aussi qu’il y ait une réelle capacité des communautés à garder cette dynamique d’auto-organisation, y compris dans la science ouverte.

Il y a plusieurs définitions possibles de ce qu’on appelle les communs, qui peuvent ensuite s’appliquer aux communs de la connaissance. Une qui est peut-être un peu simplificatrice mais qui tend, quand même, à faire un peu consensus, c’est une définition en trois éléments. On dit qu’un commun, c’est une ressource partagée, qui fait l’objet de règles définies par une communauté qui se donne une gouvernance pour auto-déterminer ses règles et il faut bien voir qu’on a un commun que si ces éléments-là sont réunis : ce n’est pas complètement une logique de communs si on a juste un seul des éléments.

De ce point de vue-là, l’activité scientifique correspond assez bien à cette définition, au sens où on a bien des ressources partagées qui vont être les connaissances qui sont produites, qui s’incarnent dans des publications, des données, des logiciels, tous les résultats de recherche. Ensuite, on a bien des communautés scientifiques et on a tout un ensemble de règles qui sont en train de se mettre en place, les licences de réutilisation en sont une, et les communautés académiques obéissent aussi à des règles en général disciplinaires, toutes les questions d’éthique de la recherche, de méthodologie scientifique, qui sont très largement formalisées. Je dirais que le point de rapprochement qui est important c’est la capacité d’auto-organisation des communautés. Les communautés de recherche ont cette capacité-là, à travers le statut des chercheurs qui leur permet d’avoir une certaine forme de liberté dans leur activité, qui leur garantit cette possibilité d’auto-organisation.

Quand on envisage la communauté qui est concernée par la question de la science, elle est plus large que les seuls chercheurs eux-mêmes. L’organisation des communautés scientifiques, leurs rapports aux pouvoirs publics, c’est déjà, en soi, un vrai sujet. Mais si on passe dans un paradigme de science ouverte, la question scientifique et la question de la réutilisation des résultats de recherche concernent aussi des associations, des entreprises et d’autres acteurs qui peuvent soit participer à la production soit se saisir des résultats.

Donc, oui, si on veut rester dans une logique de communs de la connaissance, il faudrait que la gouvernance fasse une place aussi aux ré-utilisateurs. Je crois que là tout est à inventer et tout est à mettre en place sur le sujet. Pour l’instant c’est assez significatif de voir, quand on lit le Plan national pour la science ouverte, que la dimension science participative et science citoyenne n’est pas évoquée. Ce n’est pas quelque chose qui a été d’emblée visé par le plan. Et, à mon avis, c’est une limite, c’est une lacune qui est sûrement due au fait que c’était déjà relativement difficile d’avancer sur les autres terrains du plan, mais on ne pourra pas faire indéfiniment l’impasse sur cette question. Si on met en place un volet sciences citoyennes, il faudra, à un moment, se poser justement la question de quelles instances, quelles institutions on se donne pour permettre de faire participer.

J’ai noté qu’il y a récemment toute une mobilisation d’associations qui parlent de ce qu’elles appellent « le tiers secteur de la recherche », qui ne serait pas de la recherche publique ni de la recherche privée, mais toute la recherche qui se fait dans des tiers lieux associatifs, etc., qui demande à exister et à être reconnue en tant que telle. Donc il y aura des conversations à avoir avec les acteurs de ce mouvement pour voir comment les intégrer dans le dispositif.

Les valeurs de la science ouverte

Il y a une filiation entre la science ouverte et, on va dire, les mouvements autour du logiciel libre. Je pense que si l’open access s’appelait à la base open access, c’est aussi par référence à l’open source dans le monde du logiciel ; l’open data s’est lui-même appelé comme ça par référence à l’open source.

Les points de contact avec le mouvement de la science ouverte ? Il faut voir qu’à la base les communautés du logiciel libre réagissaient à une forme d’accaparement et à un risque lié à la privatisation des logiciels. À partir des années 80, on commence à voir se structurer des grandes sociétés qui développent des logiciels, qui ferment les codes et qui empêchent le travail communautaire autour des codes partagés. Je pense que l’analogie vaut tout à fait pour la science ouverte avec cette nécessité de sortir des restrictions et des accaparements qu’on peut voir par rapport aux grands groupes éditoriaux. Philosophiquement, on appelle cette idée de lutter dans le mouvement des communs « lutter contre l’enclosure de la connaissance », cette fermeture imposée sur la connaissance ; elle est partagée dans le champ scientifique et dans le champ, à l’origine, des développeurs informatiques. Il y a une filiation forte.

J’aime bien le rapprochement qui est aussi fait avec ce que disait un spécialiste des sciences qui s’appelait Robert Merton [19], qui travaillait dans les années 50 et parlait de l’ethos de la science. Il explique que la science repose sur des valeurs et, dans les grandes valeurs, il met ce qu’il appelle le communalisme de la science, c’est-à-dire le fait de considérer que les résultats scientifiques forment un bien commun au sens où il ne peut pas faire l’objet d’une appropriation limitée par ceux qui le produisent. C’est-à-dire que la science est cumulative, on ne fait jamais qu’augmenter quelque chose qui était déjà là et qu’on passe ensuite aux générations suivantes. Donc, du coup, ça veut dire qu’on doit reconnaître l’apport qui est fait par les chercheurs individuels, mais que ceux-ci ne peuvent pas aller jusqu’à une appropriation complète des résultats de recherche qui doivent être reversés dans un fonds commun qui progresse au fil du temps. Ça vaudrait la peine de relire la science ouverte comme une sorte de retour aux sources, à l’ethos de la science que Merton avait décrit.

Au début, je disais que la science ouverte a longtemps été un mouvement, au sens où c’était porté par des chercheurs eux-mêmes qui se sont organisés pour essayer de peser aussi sur les décisions et les politiques publiques. Il y a eu effectivement une forme de militantisme associé à l’open access, à la science ouverte, qui a eu des effets. Par exemple, la loi pour une République numérique a aussi été votée parce qu’il y a eu une vraie mobilisation structurée autour du texte, qui ne venait pas seulement du monde de la recherche, on a eu aussi des engagements associatifs autour de ce texte. C’est important qu’il y ait un soutien à ces politiques-là qui vienne d’une forme d’engagement des chercheurs, mais pas que des chercheurs.

La question est un peu en train d’évoluer, parce que la science ouverte est en train de devenir une politique publique structurée. Aujourd’hui, la science ouverte n’est pas qu’une question de militants, c’est une orientation officielle du ministère de la Recherche, c’est une orientation officielle de l’Union européenne. On n’est donc plus dans une phase où la science ouverte serait portée uniquement par des militants qui essayeraient d’obtenir des avancées auprès des pouvoirs publics, ce sont les pouvoirs publics eux-mêmes qui ont endossé cet objectif. Je pense que cela change quand même significativement la donne, et peut-être que ce sont ceux qui s’opposent à la science ouverte qui sont des militants aujourd’hui.

On est, en fait, au début d’un mouvement et je pense qu’on ne voit pas toujours bien exactement les conséquences qu’il pourrait provoquer à terme si on poussait la logique jusqu’au bout. On commence à voir des initiatives qui se raccrochent à la science ouverte, qui touchent le processus même de la recherche scientifique. Toutes les logiques, par exemple, d’open peer reviewing [20], le fait de faire l’évaluation des articles en mode ouvert, en permettant d’avoir vraiment une transparence totale sur les échanges, lever la boîte noire de l’évaluation, c’est, je pense, une transformation profonde.

Il y a aussi la question de savoir si ce peer reviewing ne devrait pas être ouvert au-delà des chercheurs eux-mêmes, c’est-à-dire, à un moment donné, qu’on puisse avoir des contributions dans l’évaluation des articles qui viennent de manière complètement ouverte aussi, de personnes qui ne sont pas elles-mêmes dans le monde de la recherche. Ça nous ouvre des perspectives qui sont quand même vraiment significatives, en termes de changement.

À un moment, imaginons qu’on ait réellement les articles scientifiques placés vraiment sous licence libre et imaginons qu’ils soient sur des interfaces qui permettent d’exercer réellement notamment le droit à la modification. On pourrait imaginer ce que j’appelle une « wikification » de la science qui nous amènerait à avoir des travaux scientifiques à peu près dans le même état que l’est l’encyclopédie Wikipédia. Non seulement tout le monde pourra lire les travaux scientifiques, on aura atteint le but de l’open access, mais, en plus, on arriverait à un stade où les travaux seraient modifiables.

Que n’importe qui puisse aller modifier un article de recherche ça peut paraître assez perturbant comme idée. Mais, si on regarde comment fonctionne Wikipédia en tant que telle, on peut avoir des processus tout à fait normalisés d’incorporation des contributions et d’évaluation des contributions. Les contenus sont modifiables en ligne, Wikipedia est modifiable en ligne et on dit souvent que n’importe qui peut modifier Wikipédia, mais c’est beaucoup plus complexe. En fait il y a tout un processus de validation des contributions et quand les communautés sont bien organisées et solidement organisées, elles sont capables d’effectuer cette modération qui assure la validation des connaissances. On dit souvent que le seul endroit, sur Internet, qui a vraiment résisté au déluge de fake news au moment de la crise du Covid, c’est Wikipédia.

Donc, à terme, je pense qu’on pourrait imaginer des plateformes qui arrivent à intégrer des contributions très ouvertes, y compris sur des articles scientifiques. Mais là, le vrai défi, c’est d’avoir l’organisation communautaire derrière qui assure une sorte de peer reviewing constant sur les contributions et qui soit capable, collectivement, de décider des règles de modération. Et là peut-être qu’on arriverait à ce qu’on pourrait appeler une « wikification » de la science.

On peut se demander quelle est l’inspiration politique derrière la question de la science ouverte. Il y a notamment un point qui est souvent mis en avant, c’est que, effectivement, quand on parle d’ouverture des données de recherche, ça implique la libre réutilisation au sens fort du terme, c’est-à-dire y compris par les entreprises. Depuis longtemps, on a une critique, notamment de l’open data, qui explique que c’est une sorte de cadeau qui est fait par le secteur public au secteur privé, parce que, dans les faits, ça va aboutir à une possibilité de libre réutilisation des données publiques. Certains y voient même une sorte de mise en œuvre d’un projet néolibéral qui viendrait offrir des productions faites par le public au secteur privé.

Je pense que ce n’est pas une bonne manière de poser cette question-là. Il faut voir qu’avant la politique d’ouverture des données publiques en 2016, il y a eu des travaux de la Cour des comptes qui sont extrêmement intéressants à regarder, notamment le rapport Trojette [21], qui avait fait un audit des redevances fixées sur les données publiques. À l’époque, les données publiques faisaient l’objet de réutilisation payante, donc il y avait des redevances qui étaient demandées.
Le constat de ce rapport c’était qu’appliquer des redevances provoque une très forte limitation de la réutilisation. C’est-à-dire que potentiel de réutilisation des données était drastiquement abaissé par la barrière d’entrée et pas seulement pour les acteurs économiques, aussi pour la société civile.
Deuxièmement, c’était extrêmement peu rentable pour l’État : il y avait très peu de redevances qui produisaient de réels bénéfices.
Et enfin, qu’est-ce que ça permettait ? Ça permettait en général, à de gros acteurs positionnés sur le marché, de conforter leur position. C’est-à-dire que seulement certains acteurs économiques pouvaient se payer le prix des licences et ça créait un effet d’éviction sur certains marchés, sur les acteurs plus petits.

Donc, même d’un point de vue strictement économique, je vois difficilement l’ouverture comme une stratégie néolibérale. La possibilité pour un acteur économique de capter un actif public et de s’arroger dessus une exclusivité est en fait au contraire, pour moi, typique d’une stratégie néolibérale. Je prendrais un exemple : en Grèce, quand le pays a subi les transformations qui ont été les siennes, les acteurs privés ont dépecé les structures publiques et les ont rachetées pour avoir sur elle un contrôle. Si vous entrez dans une logique où il n’y a plus rien de rachetable, parce que c’est ça que va provoquer la politique de science ouverte, aucun acteur ne pourra plus obtenir d’exclusivité sur les données de recherche. À ce moment-là, vous avez une situation qui déverrouille complètement le paysage et qui, à mon sens, évite la constitution de grandes positions dominantes, etc.

Je pense qu’il faut rester vigilant sur ce point-là. La question de la réciprocité pourrait se poser, mais d’une autre façon : plutôt que de fermer les données de recherche, il pourrait être demandé, à un moment, que les acteurs privés aient aussi des obligations d’ouverture. Il y a notamment un concept qui revient souvent, celui des « données d’intérêt général » où on pourrait envisager qu’un élément d’équilibrage du paysage serait que des acteurs privés aient aussi des obligations d’open data. Je pense qu’un jour il faudra se poser la question, même vis-à-vis de la recherche privée. Je pense, au contraire, que tout retour en arrière qui consisterait à fermer les données nous expose au risque d’une captation par les acteurs publics.

L’évaluation de la recherche

Je pense qu’un des points de vigilance à avoir est vraiment sur la question de l’évaluation. C’est-à-dire que même dans un monde, on va dire, où tout serait ouvert, il y aurait sans doute encore possibilité d’avoir une sorte de gouvernance néolibérale de la recherche si on continuait à évaluer les chercheurs par des méthodes quantitatives — bibliométrie, facteurs d’impact, etc. —, qui peuvent tout à fait continuer à exister dans un monde où tous les contenus seraient ouverts. C’est pour ça qu’à mon avis il est vraiment indispensable de coupler le développement de la politique de science ouverte à une profonde révision des moyens par lesquels on évalue la recherche, notamment qu’on sorte de la logique d’évaluation quantitative me parait une garantie.

Recommandations aux doctorant·es et jeunes chercheuses·cheurs

Au niveau des doctorants, je pense que c’est vraiment une étape décisive, parce que c’est là où les premiers choix vont être faits, il y a donc vraiment une attention particulière à avoir vis-à-vis des doctorants. La première question qui va se poser pour eux c’est de savoir s’ils veulent mettre leur thèse en libre accès ou pas. Ça reste une faculté, aujourd’hui, du doctorant, ce n’est pas une obligation. Je pense que ce choix devrait être fait de manière vraiment mûrement réfléchi. On a souvent des retours de doctorants qui disent que c’est un choix auquel ils réfléchissent à la toute fin, voire quasiment au moment où on leur tend le formulaire où ils doivent cocher la case.

Là il y aurait peut-être un conseil à donner, pas seulement aux doctorants eux-mêmes, mais aux laboratoires et aux écoles doctorales : il faudrait absolument que cette question-là soit envisagée bien avant. Je pense qu’il y a une question particulière à poser sur les données, parce qu’on voit de plus en plus de doctorants produire des données, évidemment, pour la recherche. Cette question des données des doctorants me paraît encore vraiment un peu en dehors du radar. Et pourtant, je trouve qu’elle est très importante parce que c’est quand même le premier pas du chercheur dans cette question, éventuellement, de la science ouverte. Donc se préoccuper de ses données et essayer de savoir ce qu’on veut en faire me paraît important. J’avoue qu’un de mes rêves serait qu’on demande aux doctorants de réaliser une sorte de plan de gestion de données, peut-être pas un plan de gestion de données complet, mais qu’il y ait quand même quelque chose où on demande aux doctorants, à l’entrée dans la thèse, de réaliser un document où ils puissent se projeter sur la gestion de leurs données. Je trouve que ça apporterait beaucoup.

Libre à lire !