Delphine Sabattier : Construire l’archive universelle du code de tous les logiciels jamais écrits dans le monde, c’est la mission actuelle de Roberto Di Cosmo. Professeur, bonjour.
Roberto Di Cosmo : Bonjour.
Delphine Sabattier : Merci beaucoup d’être en plateau avec nous dans Smart Tech. Permettez-moi d’abord d’en dire un petit plus sur votre parcours, qu’on apprenne à mieux vous connaître.
Vous êtes docteur en informatique. Vous avez obtenu votre diplôme à la Scuola Normale Superiore à Pise, en Italie, et vous avez ensuite enseigné l’informatique à l’École normale supérieure française, vous avez obtenu le titre de professeur. Aujourd’hui on vous retrouve, je ne vais pas pouvoir tout citer, à la tête de plusieurs organismes majeurs dans le domaine du développement logiciel. Vous avez publié des dizaines d’articles dans des revues et conférences internationales. Vous êtes également membre du Comité d’orientation pour la science ouverte en France, qui est un plan national porté par la ministre Frédérique Vidal, ministre de l’Enseignement supérieur, de la Recherche et de l’Innovation, pour développer l’accès ouvert et aussi la diffusion, sans entrave, aux publications et données de la recherche. Et puis vous êtes professeur d’informatique à l’université Paris Diderot, en ce moment détaché auprès de l’Inria [Institut national de recherche en informatique et en automatique] pour diriger ce projet, Software Heritage. C’est la cinquième année, en tout cas vous avez célébré le cinquième anniversaire de Software Heritage qui est une initiative en faveur de la préservation et du partage du patrimoine logiciel, projet lancé en 2016, pour être précise, par l’Inria en partenariat avec l’Unesco.
Où en est-on aujourd’hui après ce cinquième anniversaire ?
Roberto Di Cosmo : Tout d’abord merci de l’invitation. C’est vraiment un plaisir d’être ici avec vous pour partager un petit peu la passion qui nous anime derrière une initiative comme celle-là.
Si on regarde autour de nous, on voit qu’il y a effectivement du logiciel partout. Sans le logiciel, d’ailleurs, on n’aurait pas pu maintenir une vie sociale raisonnable dans cette situation de crise, mais on a tendance à oublier que le logiciel ne tombe pas du ciel. Il est écrit par des développeurs, par des êtres humains, c’est une création de l’esprit. D’ailleurs même les termes qu’on utilise « écrire le code source d’un logiciel », c’est un acte de création, d’écriture. On ne le voit pas trop parce que si on n’est pas développeur on n’a pas vraiment accès à ces types de code qui sont la recette de fabrication des logiciels.
Dans le passé, l’industrie logicielle était basée sur un modèle économique qui était essentiellement de vous vendre un executable avec une licence et on gardait super secret la recette de fabrication qui était le code source. Avec le mouvement du logiciel libre et de l’open source, qui fêtent aussi une bonne trentaine d’années, tout ça a changé. Aujourd’hui il y a énormément de code source logiciel qui est réutilisé, développé de façon collaborative de partout et qui est indispensable au fonctionnement de notre société.
Delphine Sabattier : Ce qu’on ne dit pas non plus suffisamment c’est que derrière toutes les grandes plateformes numériques on trouve du code source ouvert, libre.
Roberto Di Cosmo : Absolument. Il y a énormément de logiciel libre qui est réutilisé partout, pour une raison toute simple : la complexité des systèmes informatiques est devenue tellement grande que personne, même pas les plus grandes entreprises ne peuvent tout refaire toutes seules, en interne. Donc on est obligé de réutiliser des briques logicielles qui sont partagées avec d’autres et il y a énormément de composants en logiciel libre que vous allez trouver partout même si la dernière couche, celle qui est toute fine, qui vous est présentée à la fin, est souvent gardée secrète.
Delphine Sabattier : Vous commencez par là, par expliquer que le logiciel est une œuvre de création. Selon vous ce patrimoine logiciel est un patrimoine culturel, scientifique ?
Roberto Di Cosmo : Exactement. Merci de me pousser là-dedans. J’insiste sur le fait que c’est une création humaine. Souvent on a tendance à penser que c’est juste un outil technique, que c’est juste un outil marginal. Même dans le monde de la recherche on avait tendance à prêter beaucoup d’attention aux publications scientifiques. Récemment on s’est rendu compte que les données sont nécessaires et seulement très récemment on s’est aperçu que sans les logiciels, on ne sait pas traiter toutes ces données et on ne sait pas dire pourquoi on a obtenu tel résultat à la suite de telle expérience. C’est seulement récemment qu’il y a une prise de conscience et vraiment des plans, comme celui que vous mentionnez de la ministre de la Recherche, pour mettre les logiciels au centre de l’attention aussi dans la recherche. D’ailleurs on a lancé un prix national [1] science ouverte - Logiciel libre et données de la recherche dont les résultats seront annoncés en février, qui braque un coup de projecteur justement sur l’énorme contribution, par ailleurs française, on a tendance à l’oublier. La France joue un rôle de premier plan dans le développement du logiciel libre mondial, même si, évidemment, ça fait après partie d’un patrimoine mondial, pas seulement français.
Delphine Sabattier : Quand on pense à patrimoine, archive, universel, on a des références comme la BnF [Bibliothèque nationale de France], pour la bibliothèque des ouvrages, on peut penser à l’INA [Institut national de l’audiovisuel]. Comment faites-vous pour collecter du code source ? Quelle est l’ampleur de la tâche ? Est-ce que c‘est simple de récupérer le code du logiciel ? Comment est-ce qu’on archive, concrètement, ce patrimoine ?
Roberto Di Cosmo : Effectivement, c’est une tâche qui n’est pas facile du tout. Vous me posez la question : où en est-on depuis cinq ans quand on a annoncé au monde qu’on se lançait dans cette initiative. Finalement on a construit une sorte de gigantesque aspirateur qui se connecte aux plateformes de développement collaboratives des logiciels. Il y en a de très populaires, très connues comme GitHub, comme GitLab, comme Bitbucket. Il y a plein d’instances de plateformes de développement maintenues par telle ou telle autre communauté, entreprise, université, centre de recherche, il y en a des milliers sur la planète. Il faut se connecter à chacune de ces plateformes, voir ce qu’elles contiennent et essayer d’aspirer le contenu de ces logiciels, pas seulement les codes sources mais aussi tout leur historique de développement. On garde vraiment toute la trace de toutes les modifications qui ont été faites sur des décennies. Vous voyez la difficulté.
Delphine Sabattier : Vous mettez ça sur des datacenters géants ?
Roberto Di Cosmo : Vous allez voir. C’est intéressant.
Il faut aller récupérer tout ça. Je disais que c‘est compliqué parce qu’il n’y a pas un protocole standard, donc il faut construire des adaptateurs technologie par technologie, c’est une énorme tâche qu’on n’arrivera jamais à résoudre tout seuls avec notre équipe, il faut un effort des communautés. On archive des codes sources qui sont disponibles grâce à la mouvance du logiciel libre, mais on va y arriver grâce à la même philosophie que celle du logiciel libre en faisant appel à une large communauté qui travaille avec nous. Nous construisons l’infrastructure de base et nous sollicitons des experts au niveau mondial pour contribuer à développer avec nous ces adaptateurs. On a commencé à les réunir. Il y en avait une dizaine qui étaient à l’évènement de la semaine passée à l’Unesco.
Delphine Sabattier : Justement, est-ce que ça part d’une demande de la communauté du logiciel libre ? De quoi cette initiative part-elle ? Et ensuite à qui sert-elle et à quoi ?
Roberto Di Cosmo : En réalité ça ne part pas d’une demande, ça part d’une observation. On s’est rendu compte par hasard, il y a sept/huit ans, quand on travaillait sur d’autres sujets : alors que, comme vous l’avez mentionné, vous avez plein d’organisations qui s’occupent d’archiver énormément d’informations en particulier numériques aujourd’hui, pour l’image vous avez l’INA, pour les documents numériques liés au livre vous avez la BnF.
Delphine Sabattier : Le projet Gallica.
Roberto Di Cosmo : Voilà, Gallica. Pour le Web vous avez l’Internet Archive [2] qui archive le Web, on s’est aperçu qu’il n’y avait strictement personne, aucune organisation qui s’était donné pour mission d’archiver tous les codes sources. On pouvait aussi se dire « ce n’est pas grave parce qu’ils ne vont pas disparaître ».
Delphine Sabattier : Est-ce que ça a une utilité aussi ? La question de la finalité.
Roberto Di Cosmo : Exactement. En 2015 on s’est aperçu qu’on avait des grandes plateformes qui effectivement fermaient, qui mettaient en danger des millions de projets. Ce qui veut dire que les personnes qui utilisaient ces projets-là et qui faisaient confiance au fait qu’elles allaient les retrouver quand elles revenaient dans six mois, dans un an ou dans une semaine, elles reviennent et découvrent que c’est fermé, il n’y a plus rien. Qu’est-ce qu’on fait ? Vous avez perdu des millions de projets. Donc l’utilité est devenue immédiatement claire autour de 2015, même avant qu’on l’annonce, parce que, pour la première fois, on avait la disparition de centaines de milliers, de millions de projets qui été réutilisés et ça continue, même encore récemment des projets ont été effacés par mégarde ou pour d’autres décisions. Notre archive permet de les retrouver et de s’assurer qu’un code source sur lequel vous avez posé un enjeu stratégique pour vous, qui est essentiel pour votre entreprise, pour votre développement ou pour un résultat scientifique, sera vraiment là demain et après-demain et dans dix ans, etc.
Donc oui, c’est un premier usage, ne pas perdre.
Delphine Sabattier : D’accord. D’ailleurs à ce sujet l’accès est totalement libre, ouvert, gratuit ?
Roberto Di Cosmo : Absolument. La mission est effectivement de faire une infrastructure commune au service de l’humanité tout entière, donc de mettre l’accès ouvert à tous. Après, on n’a pas les moyens d’un Google ou d’un Amazon. Donc évidemment qu’on a des limitations sur la quantité de connexions que vous pouvez faire par minute parce qu’on n’a pas une infrastructure gigantesque non plus. L’idée c’est vraiment un accès ouvert à tous.
Delphine Sabattier : Vous citez Google, Amazon, Apple et Microsoft, les nouveaux géants du numérique aujourd’hui. Est-ce que ce projet est d’autant plus pertinent face à ces puissances qui se retrouvent dans des situations pratiquement monopolistiques ?
Roberto Di Cosmo : Oui. Vous avez tout à fait raison. Si vous me permettez une petite parenthèse. Si vous regardez les plus grandes capitalisations boursières aujourd’hui aux États-Unis, ce sont toutes des entreprises qui, d’une façon ou d’une autre, maîtrisent un graphe, ces structures avec des nœuds et des arêtes qui ont des relations particulières entre elles. Par exemple Google maîtrise les graphes du Web qui est pourtant une information publique, n’est-ce pas ?, mais ils sont les seuls à avoir la capacité réelle de l’exploiter parfaitement. Derrière vous avez Bing qui est quand même pas mal. Vous avez Facebook qui exploite les graphes de nos relations sociales. Vous avez Linkedin, qui avait été racheté par Microsoft pour des milliards, qui contrôle le graphe de nos relations professionnelles. Vous voyez que ce sont toutes des grandes entreprises dont le modèle économique est basé sur le fait de maîtriser un graphe duquel on extrait de la valeur.
Software Heritage [3], en réalité, construit et maintient le graphe du développement logiciel mondial. Vous avez tous les codes sources, toutes leurs modifications, toutes les personnes qui ont travaillé, tous les projets sur lesquels elles ont fait des modifications, dans une seule et unique structure, sur laquelle, si on avait voulu, on aurait pu construire une grande entreprise, une grande start-up, mais ce n’est pas ça. L’idée c’est justement construire ce graphe, le mettre à disposition de tous et de mutualiser cette infrastructure qui est au service de l’humanité tout entière et pas juste d’un groupe d’actionnaires localisés dans un pays particulier.
Delphine Sabattier : Ça veut dire, si j’essaye de décrypter ce que vous nous expliquez, que ce n’est pas vraiment un contre-pouvoir, c’est-à-dire que vous ne construisez pas contre des puissances. En revanche, ça permet de s’assurer que l’humanité reste en possession des logiciels, donc finalement d’avoir une certaine autonomie numérique ?
Roberto Di Cosmo : Exactement, maintenir. Et c’est ça qui est surprenant. On avait une mission au service de l’humanité tout entière, donc une infrastructure commune. Mais après, petit à petit, en particulier en cette période de crise Covid dans laquelle tous les pays se sont aperçus que ce n‘est pas bien de ne pas maîtriser certaines briques essentielles pour ses entreprises ou pour leurs chaînes de fabrication, on s’est aperçu que finalement ce qu’on fait – on construit cette archive qui contient tous les codes sources utilisés sur la planète, on les met à disposition de tous et on met en place une stratégie de construction de miroirs, c’est-à-dire la possibilité d’avoir des copies de cette même archive dans différents pays, dans différents lieux – fait en sorte que finalement on restitue de l’autonomie stratégique à chaque pays tout en maintenant un bien commun universel. Ce n’est pas si simple au début, mais, pouvoir faire ça, c’est quelque chose de passionnant, de fascinant.
Delphine Sabattier : Je vous amène là-dessus parce que c’est, finalement, presque une mission politique au sens noble du terme. Vous êtes une sommité du logiciel, très engagé. Vous prônez l’adoption du logiciel libre depuis très longtemps, vous avez même un premier ouvrage qui a été publié en 1998, qui a fait grand bruit, qui s’appelait, qui s’appelle toujours si on veut le lire, Le hold-up planétaire. À l’époque vous mettiez en garde contre les ambitions, cette boulimie de Microsoft qu’on appelait le Big Brother. Les forces ont quand même été déplacées, aujourd’hui Microsoft n‘est plus le grand méchant, mais pour autant on a toujours cette même problématique de monopole, de position dominante qui pose problème aujourd’hui et face à ça on peut opposer le logiciel libre ?
Roberto Di Cosmo : Oui, tout à fait. Il y a un phénomène spécifique à l’informatique qui est un effet réseau. C’est comme les téléphones. Quand on est tout seul à avoir un téléphone ça ne sert à rien, quand on commence à être deux, au moins parler à deux. Quand il y a un million de personnes qui ont un téléphone, on ne peut pas se passer d’avoir un téléphone pour pouvoir communiquer avec tout le monde.
Avec le logiciel vous avez le même phénomène. Il y a une sorte de premier arrivant qui maîtrise, qui capture un marché et qui contrôle tout. À l’époque c’est Microsoft qui était super bien positionné pour essayer de tout maîtriser de la chaîne de l’information, de la production à la diffusion, au traitement de l’information. Finalement ils ont perdu cette position de primauté qui a été reprise par d’autres. Vous avez beaucoup d’autres acteurs, on parle des fameux GAFAM, il y en a plein, qui sont en position de monopole. La question, si je peux approfondir un peu, ce n’est pas seulement les logiciels libres, parce que tous ces acteurs utilisent du logiciel libre. D’ailleurs, si vous regardez, Microsoft est un des premiers contributeurs du logiciel libre sur Git Hub aujourd’hui, ce qui semble révolutionnaire.
Delphine Sabattier : Donc, vous me l’avez dit en préparant l’émission, le logiciel libre a gagné, mais il a gagné quoi ?
Roberto Di Cosmo : Il a gagné qu’il est adopté par tous, mais le problème s’est déplacé d’une certaine façon. Maintenant c’est la maîtrise des infrastructures et la maîtrise des données qui deviennent essentielles. C’est-à-dire que tout le monde utilise du logiciel libre, mais qui pilote le développement de ces logiciels libres ?, c’est une question stratégique importante. Il ne suffit pas d’être juste un utilisateur, il faut être dans la cabine de pilotage de ces logiciels libres et, des fois, on a tendance à l’oublier. Il ne suffit pas d’utiliser un logiciel libre qui est très important, il faut s’assurer d’avoir des personnes de confiance qui sont dans le groupe central qui décide de l’évolution du logiciel.
Delphine Sabattier : C’est-à-dire des fondations comme la Fondation Mozilla [4] par exemple ?
Roberto Di Cosmo : Par exemple.
Delphine Sabattier : Mais qui est aujourd’hui grandement financée par Google.
Roberto Di Cosmo : Exactement, c’est un modèle économique intéressant, ça mériterait une émission.
Delphine Sabattier : On ne va pas avoir le temps, je suis d’accord, pas tout de suite.
Roberto Di Cosmo : Il y a des logiciels stratégiques et je pense que c’est un enjeu aussi pour tous les États et pour les entreprises. Quand un logiciel est stratégique pour une entreprise ou pour un État, il faut s’assurer de contribuer suffisamment pour pouvoir orienter son développement ; c’est une action communautaire mais qui n’est pas anarchique, il y a une gouvernance, une prise de décision. Il faut être capable de participer à la prise de décision, ça signifie un vrai engagement et tout le monde n’est pas encore formé.
Oui, le logiciel libre a gagné parce que tout le monde l’utilise, souvent même sans le savoir, mais il y a plein de choses qui n’ont pas encore été suffisamment apprises. Après il faut se poser la question de quelle est la valeur stratégique des investissements qu’on fait dans ce logiciel et dans les infrastructures pour la collaboration.
Delphine Sabattier : Qu’est-ce que c’est qu’une infrastructure ? Une infrastructure pour la collaboration, de quoi nous parlez-vous exactement ? Ici quand on parle d’infrastructure on parle par exemple de cloud.
Roberto Di Cosmo : De machines, de fils.
Delphine Sabattier : Qu’est-ce qu’on peut construire comme type d’infrastructure collaborative, qui servirait de bien commun puisque c’est votre combat de toujours, servir le bien commun ? Comment crée-t-on une infrastructure pour le bien commun ?
Roberto Di Cosmo : Souvent le terme infrastructure nous fait penser à des objets physiques : des machines, des ponts, des routes, des câbles.
Delphine Sabattier : Des backbones.
Roberto Di Cosmo : Et là, effectivement, il y a tout un enjeu de comment on architecture une infrastructure comme ça. Mais il y a un deuxième volet. Le terme infrastructure s’utilise aussi pour des organisations sociales. C’est-à-dire que quand on parle d’infrastructure, de collaboration, c’est aussi comment vous architecturez les relations entre différentes parties prenantes autour d’un sujet commun. Par exemple, si je reviens sur le cas précis de Software Heritage, l’initiative que je pilote, il y a un sujet technique. L’infrastructure ce sont les câbles, les fils, comment on met en place tous les serveurs pour récupérer tout ça et comment on s’assure de ne rien perdre en mettant des copies un peu partout, c’est l’infrastructure au sens traditionnel du terme.
Après on a l’infrastructure qui est comment on organise la prise de décision autour de ça, comment on amène plein de partenaires à travailler ensemble, à partager la mission et là vous devez mettre en place une infrastructure de collaboration.
Delphine Sabattier : C’est de la gouvernance ?
Roberto Di Cosmo : C’est de la gouvernance, des principes, des valeurs, un ensemble d’éléments qui font en sorte que vous ayez une communauté qui va dans la même direction. Ce n’est pas très différent d’une démocratie.
Delphine SabattierAu niveau mondial, on n’a pas encore réussi à le faire.
Roberto Di Cosmo : Ah non ! Mais là justement, l’espoir qu’on a, c’est qu’autour du code source des logiciels on puisse arriver à comprendre que les enjeux sont communs. Par exemple s’assurer qu’il n’y a pas de portes dérobées dans un logiciel qui est utilisé par tous, c’est dans l’intérêt de tout le monde à l’exception de quelques pirates, mais la majorité des gens préfère avoir un logiciel qui fonctionne bien plutôt qu’un logiciel qui fonctionne mal. Là il y a un enjeu commun sur lequel on essaye de miser en espérant, justement, arriver à fédérer plein de partenaires pour contribuer à maintenir une infrastructure dont le coût, comparé à un télescope spatial ou à autre chose, est infiniment inférieur, mais qu’il faut bien partager entre tous.
Delphine Sabattier : Ça veut dire quoi ? Rédiger une sorte de constitution pour le logiciel ? Une constitution universelle avec des standards, des règles de vie commune, finalement, autour du logiciel ?
Roberto Di Cosmo : Exactement. C’est un peu ça l’enjeu d’aujourd’hui. Vous le voyez, c’est répété à plusieurs endroits, c’est pour ça qu’on parle souvent d’enjeux de gouvernance autour des logiciels libres, etc. C’est cette partie-là qui nécessite encore pas mal d’attention, de prise de conscience et de maturité des différents acteurs qui sont autour. Ça veut dire aussi, pour les personnes qui nous suivent, qui sont habituées dans notre monde technologique à regarder les enjeux, les coûts, le retour sur investissement, etc., eh bien là il faut rajouter aussi, dans le calcul de ces retours d’investissement, etc., quel est le coût ou la valeur des composantes en logiciel libre qui sont stratégiques pour une entreprise, sur lesquelles on doit pouvoir orienter l’évolution future.
Delphine Sabattier : Malheureusement, Roberto Di Cosmo, on arrive à la toute fin de cette séquence grande interview. Je voulais quand même qu’on fasse ensemble ce format interview express. Je vous pose une question rapide, vous me répondez aussi brièvement que possible, ça peut être un peu plus personnel mais peut-être que c’est en lien avec notre sujet précédent : vos rêves Roberto Di Cosmo ?
Roberto Di Cosmo : Mes rêves, mes cauchemars, ça dépend !
Delphine Sabattier : C‘est la deuxième question. Vos rêves, vos peurs, on peut faire en même temps.
Roberto Di Cosmo : Je dirais que c‘est depuis tout petit, en réalité je ne sais pas pourquoi, mais on ne va pas faire une séance de psychologie.
Delphine Sabattier : On a dit une réponse brève en plus.
Roberto Di Cosmo : C’est effectivement de réussir à contribuer à construire des infrastructures et des biens communs vraiment au service de l’humanité tout entière. Mon nom est Di Cosmo ; dans « Di Cosmo », il y a cosmos, cosmos c’est l’ensemble. Et, d’une certaine façon, je me suis toujours senti citoyen du monde, ce qui n’empêche pas d’être attaché à un pays. En réalité je rêve d’un monde un peu plus ouvert que ce qu’on voit aujourd’hui, plus uni, dans lequel vous avez des êtres humains qui mettent leurs capacités ensemble, pour construire un avenir meilleur. Ça fait un peu… Mais c’est vraiment mon rêve.
Delphine Sabattier : Merci beaucoup Roberto Di Cosmo. On n’aura pu faire qu’une question express ensemble, mais c’était passionnant.
Merci à tous de nous avoir suivis. À suivre c’est le rendez-vous Smart Space avec notamment, au programme l’interview de Bruno Lemaire sur la politique spatiale. On se retrouve dès lundi, on enchaînera avec de nouvelles discussions sur la tech. Merci beaucoup. Excellent week-end à tous.