Diverses voix off : Punaise, j’ai trop hâte de ce nouvel épisode.
Encore une bière. C’est open bar !
Thibaut, tu bois encore une bière ? C’est open bar. On y va.
Les gars, aujourd’hui c’est open data et ça, c’est vraiment d’utilité publique.
Open data, d’accord, open data.
Diverses voix off, série Silicon Valley : On pourrait construire une version absolument décentralisée de notre Internet actuel. Ça veut dire pas de firewalls, ni de restrictions, ni de mainmise par des gouvernements. Aucune limite, que de l’information, totalement libre et gratuite, dans tous les sens du terme.
Tu veux construire un nouvel Internet ?
Voix off : Trench Tech. Esprits Critiques pour Tech Éthique.
Cyrille Chaudoit : Hello. Cyrille Chaudoit au micro. Oui, vous êtes bien dans Trench Tech avec bien sûr, à mes côtés, Thibaut le Masne.
Thibaut le Masne : Hello ! Hello !
Cyrille Chaudoit : Et Mick Levy.
Mick Levy : Yo ! Yo !
Cyrille Chaudoit : D’abord un petit mot pour toi qui nous écoutes. Merci. Vous êtes de plus en plus nombreuses et nombreux à nous écouter, alors continue, toi, toi, et toi aussi, de partager nos épisodes pour partager l’esprit critique pour une tech éthique.
Messieurs, qui a reconnu l’extrait qu’on vient d’entendre ?
Thibaut le Masne : La série Silicon Valley.
Cyrille Chaudoit : Bravo Thibaut ! Et pourquoi cet extrait, à votre avis ?
Mick Levy : Parce que notre invitée y a débuté sa carrière, peut-être.
Cyrille Chaudoit : Exact, du coup ça tombe à pic, pas vrai Mick ? Oui, je sais !, parce que dans cet épisode, on va se demander quelle place pourrait jouer l’open data dans la construction d’un numérique au service de l’émancipation citoyenne, et cela, en contrepoint, ou pas, de la mainmise des Big Tech sur toutes nos données.
Laure Lucchesi a donc d’abord été envoyée dans la Silicon Valley pour le compte de l’ambassade de France aux USA, avant de mener des projets d’innovation dans les télécoms, les médias et la banque en Afrique et en Inde, puis de devenir directrice d’Etalab [1], pendant sept ans, de 2016 à 2023. Rappelons qu’Etalab est le département du Premier ministre chargé de l’innovation et de la transformation numérique du service et de l’action publique et grâce aux données. Puisque Laure aide désormais les entreprises à accélérer leur transformation data et IA, on peut dire que c’est l’invitée idéale, car elle maîtrise les deux facettes, publique et privée.
C’est vrai, après tout, l’esprit critique, c’est, d’un côté, questionner cette manie que les géants de la tech ont de privatiser la mise en données de toute chose en ce bas monde, mais aussi de se demander en quoi les données publiques sont un bien commun comme un autre, qu’il faudrait mettre à la disposition de tous, y compris, d’ailleurs, d’acteurs privés, y compris les géants de la tech. Vous me suivez ? Ça va ?
Mick Levy : On va quand même approfondir tout ça !
Cyrille Chaudoit : Bref ! Nous commencerons donc par revenir sur le parcours de Laure pour voir quels liens elle fait entre les stratégies observées dans la Silicon Valley et celles poursuivies par l’État français en matière de données ouvertes. Ensuite, nous tenterons un état des lieux du numérique public, pour, enfin, nous demander en quoi mettre à disposition la data redonne du pouvoir à la société civile. Mais ce n’est pas tout, deux chroniques que vous adorez viendront compléter le décor : « Débats en Technocratie » de Virginie Martins de Nobrega et le fameux « Patch Tech » de Fabienne Billat.
Mick Levy : Ça fait longtemps qu’on ne l’a pas entendue.
Cyrille Chaudoit : Grand retour, exactement, c’est pour cela qu’on se réjouit. Et, dans maintenant moins d’une heure, chers amis, nous débrieferons juste entre vous et nous, cher public, des idées clés partagées avec Laure dans cet épisode. Restez donc jusqu’au bout. Vous êtes prêts ?
Mick Levy : Je suis méga prêt, carrément.
Cyrille Chaudoit : Alors, sans plus tarder, accueillons la dompteuse de données publiques, comme l’a nommée le JDD. Bonjour Laure.
Laure Lucchesi : Bonjour !
Mick Levy : Salut Laure.
Thibaut le Masne : Bonjour Laure.
Cyrille Chaudoit : Laure, nous sommes ravis de t’accueillir. On se tutoie ?
Laure Lucchesi : Avec plaisir.
Cyrille Chaudoit : Alors c’est parti pour notre grand entretien, vous êtes bien dans Trench Tech et ça commence maintenant.
Voix off : Trench Tech. Esprits Critiques pour Tech Éthique.
De la Silicon Valley à l’innovation publique
Mick Levy : Laure, on l’a dit, tu as expérimenté la culture de l’innovation de la Silicon Salley puis, de retour en France, tu cherches, finalement, à appliquer ses stratégies innovantes au service public de la France. Laure, finalement, comment la Silicon Valley a-t-elle influencé ta vision de l’innovation ? Grande question.
Laure Lucchesi : Ça a été vraiment marquant pour moi. En fait, je suis sortie d’école en 2001, juste après le 11 septembre, la crise, et j’ai eu l’occasion de travailler pour le département économique de l’ambassade de France en Californie, à San Francisco, où je couvrais le secteur des médias et de l’entertainment, comme on dit aux États-unis. C’était juste après l’éclatement de la bulle internet aussi, c’était donc vraiment une phase de transition. J’ai pu prendre la mesure de l’ampleur avec laquelle la technologie disruptait, percutait de plein fouet tout un secteur et toute une industrie, puisque c’était à la fois le moment où il y avait la numérisation des réseaux, on commençait à voir la distribution des contenus sur le câble numérique ou les réseaux satellites, l’arrivée de nouveaux acteurs. À l’époque, un acteur envoyait des DVD par la poste, qui s’appelait Netflix.
Mick Levy : Laurent Guérin nous a fait une jolie chronique, « Un moment d’égarement », il n’y a pas si longtemps avec le fail, qui s’en est suivi sur cette activité [2]. Intéressant que tu le rappelles.
Laure Lucchesi : C’était très compliqué. J’avais rencontré Reed Hastings [3] et il savait déjà que sa vision c’était de devenir une tech company et de faire de la vidéo à la demande sur Internet. C’était aussi les User Generated Contents qui changeaient complètement la façon dont les contenus étaient produits et distribués et qui percutaient le modèle des studios. Bref, je me suis rendu compte que la technologie disruptait complètement l’économie, la société et les rapports de pouvoir. Ça m’a évidemment profondément marquée. Après deux ans, je suis rentrée en France et là j’ai eu l’occasion de travailler sur des grands projets de transformation dans les médias, dans les télécoms, dans les services financiers aussi, à la fois en France et un peu partout dans le monde. Après avoir eu toute cette expérience, j’ai eu l’occasion de mettre ce savoir-faire et ces compétences au service de la transformation de l’action publique, de l’action de l’État, en entrant par ce qui était ce petit sujet de l’open data.
Mick Levy : Finalement la Silicon Valley, tu l’as dit, cherchait à disrupter tout un tas d’industries, et parmi les industries que cherchait à disrupter la Silicon Valley, je mets « industries » entre guillemets, il y a aussi le service public, l’action publique, il y a plein de fois où ils sont venus un peu en percussion avec la façon dont se faisait l’action publique. Toi, finalement, qu’est-ce que tu as souhaité prendre ? Quelles sont les leçons, finalement, que tu as apprises et que tu as voulu, ensuite, appliquer pour l’action publique, en particulier chez Etalab [1] ?
Laure Lucchesi : Ce sont vraiment beaucoup de choses. Ce qui était fascinant, c’est, évidemment, cette capacité à agir vite, à tester, à itérer, à partir petit et à développer plus largement des services, donc, à la base, ce sont des méthodes agiles qu’on a ensuite appliquées dans l’administration, c’est un premier sujet.
Il y avait aussi, qui est née aux États-Unis entre le début des années 2000 et 2010, cette théorie d’agir comme une plateforme ; ça a été vraiment fondateur et c’est ce qu’on a amené en entrant par le sujet de l’open data : se dire que les stratégies gagnantes, à l’heure d’Internet, ce sont celles des plateformes qui ont plus de valeur qu’une application puisqu’elles attirent dans un écosystème, dans un environnement qu’elles maîtrisent, la capacité de contribution, la création de valeur mais selon des règles qu’elles définissent.
Le parallèle a été fait aussi avec ce que peut être l’action publique, l’action d’un gouvernement, qui, lui-même, peut agir comme une plateforme et amener à lui de la contribution, de la capacité d’innovation.
Thibaut le Masne : Je ne peux pas m’empêcher de te poser quand même cette question. Quand on parle d’agilité et de scalabilité on va dire des start-ups ou des Big Tech et de l’agilité, de la souplesse d’un État, je ne peux pas m’empêcher de dire que ce n’est pas tout à fait la même chose ! Non ?
Laure Lucchesi : Bien sûr. Évidemment que l’administration est tenue par des règles, par des obligations aussi qui lui sont propres : la continuité du service public, l’égalité devant le service public ; typiquement, elle ne peut pas choisir ses clients comme pourrait le faire, justement, une start-up ou une entreprise. Mais elle est aussi tenue par un principe, le troisième principe du service public, qui est celui de l’adaptation et de la mutabilité. Elle, doit donc à la fois fournir et produire le service public correspondant, d’un côté, aux attentes de la société, mais aussi au progrès technique. Ça a été vrai pour un certain nombre de révolutions par le passé, et c’est vrai, aussi, pour l’adaptation de la technologie.
En fait, l’administration a aussi le devoir de mettre à jour son propre logiciel et de saisir les opportunités du numérique pour agir différemment.
Mick Levy : Justement, Laure, j’ai une petite question là-dessus. Tu as évoqué la notion de plateforme. Déjà, la notion de plateforme, pour les Big Tech, n’est pas toujours bien comprise, il y a beaucoup d’éléments. Finalement, ce sont des services, c’est le fait de fournir des services racines, qui sont racines de plein d’autres services, c’est le fait d’une espèce de coopétition avec beaucoup d’acteurs, c’est le fait de donner des services élémentaires qui peuvent être réutilisés d’une autre manière. Est-ce que tu peux le définir et puis, surtout, comment on le transcrit dans la notion de l’État plateforme, sur laquelle tu arrives derrière ?
Laure Lucchesi : Justement, tu parles de services, mais, finalement, c’est presque l’inverse, c’est-à-dire que souvent les grandes plateformes — Facebook, Amazon — ont commencé par un service et, petit à petit, elles s’en sont écartées pour fournir une infrastructure, des règles, notamment des modèles économiques, pour attirer l’innovation à l’intérieur d’un écosystème et d’un environnement qui étaient à leurs mains et qu’elles contrôlaient. C’est ça qui fait la différence. Si on transpose ça à ce que ferait un État, et ça a été théorisé en 2010 par Tim O’Reilly [4] dans Government as a Platform, c’est vraiment cette notion de fournir une infrastructure et des règles dans le monde numérique, sur laquelle des services, y compris des services créés par des tiers, qui ne sont pas l’administration, peuvent venir s’installer. Si on fait le parallèle, c’est comme si, à l’échelle d’une ville, on organisait l’infrastructure, on fournissait la route, on définissait les règles du code de la route et, par-dessus ça, vient se créer une infrastructure économique, des bâtiments.
La notion d’État plateforme, c’est celle-ci et ça veut dire qu’on considère que toutes les ressources numériques, les données, les API [Application Programming Interface ], le code, qui peuvent être, qui sont déjà produites par les systèmes d’information de l’État, tout ce qui peut être ouvert et rendu réutilisable, donc utilisable par d’autres, doit l’être ; ça doit être ouvert et partagé, parce que ça devient capacitaire, ça démultiplie la valeur et même, du coup, ça donne des nouvelles vies à des données qui sont déjà financées par l’impôt et produites par l’administration, sous réserve, bien sûr, des données qui sont confidentielles ou protégées par des secrets, on n’en parle pas, mais il y en a beaucoup qui ne sont absolument pas couvertes par toutes ces restrictions-là et qui créent, donc, de la capacité dans d’autres administrations, mais aussi à l’extérieur de l’administration.
Cyrille Chaudoit : Juste pour qu’on résume, parce ça me semble hyper fondateur pour ceux qui nous écoutent. Objectivement, l’open data ça me parlait, évidemment, mais je pense que je ne connaissais pas un dixième de ce que ça couvre exactement. Donc, là, on touche un point hyper important.
On a reçu, il y a quelques émissions de cela, Henri Verdier [5] qui nous parlait, justement, d’État plateforme, tu t’en doutes, qui nous expliquait très bien que quand on est chez Facebook on n’est plus sur le Web, on est véritablement chez Facebook avec ses frontières, avec ses lois, etc. Ce que l’on comprend déjà là, en creux, c’est que l’open data, le fait de mettre à disposition les données publiques, c’est finalement un gage de partage et de liberté, dans un sens.
Maintenant que tu nous as posé la définition, en tout cas la philosophie de l’open data, j’aimerais bien que tu reviennes peut-être deux secondes sur le but, l’enjeu à la fin de tout cela et aussi comment ça marche un petit peu.
Laure Lucchesi : Absolument. On peut le prendre sous plusieurs angles et c’est ça qui est intéressant.
Encore une fois, là on parle dans l’univers du service public et des données de l’administration, mais l’open data s’applique à n’importe quel type d’organisation, c’est une stratégie, ce n’est pas une obligation réglementaire ou légale maintenant en France.
Cyrille Chaudoit : Une boîte privée peut mettre à disposition sa data ?, c’est ce que tu veux dire.
Laure Lucchesi : Oui. On voit plein d’acteurs privés qui ouvrent, qui partagent leurs données, celles qu’ils le choisissent, qui les rendent justement disponibles à d’autres, là encore pour attirer un écosystème d’innovations qui vient compléter, augmenter, les services que cette organisation-là propose. C’est un premier angle de l’open data, c’est de dire : en partageant mes données, je vais pouvoir prolonger, amplifier, créer d’autres services qui vont venir compléter ce que je suis en train de faire ; c’est une stratégie d’écosystème.
Cyrille Chaudoit : Oui. D’autres vont jouer le jeu, vont innover, donc, quelque part, j’en retire quelque chose moi aussi.
Laure Lucchesi : Exactement. C’est ce qu’on voit, par exemple, sous forme de store dans certaines applications.
C’est donc un premier angle, celui qui crée de l’innovation et qui crée aussi de la valeur économique dont l’acteur, qui met à disposition ses données, récupère une partie. C’est un premier angle.
Il y a un autre angle qui est plutôt celui de la transparence ou de rendre compte. On rend disponibles, sous forme de données, et ça change quand même un peu la donne, un certain nombre d’informations sur son activité. Là aussi, ça peut être fait par des entreprises qui publient un certain nombre de données sur leur activité et c’est fait aussi par l’État. C’est donc une façon de rendre compte et de donner à voir ce que font l’administration et le service public. Ce sont, par exemple, les données qui sont publiées sur les résultats des élections, sur la propagation de l’épidémie qu’on a connue avec le Covid, sur la vaccination. Ce sont aussi toutes les statistiques publiques qui sont le reflet de ce que fait l’État. Il y a donc un autre axe, qui est celui de la transparence, mais, cette fois, sous forme de ressources numériques. Le fait que ce soient des données et pas seulement comme si on avait accès à un document administratif sur papier, c’est là que l’ère de la donnée change la donne : on peut croiser ces données, les analyser, en faire autre chose, donc ça donne un contre-pouvoir démocratique qui permet, notamment aussi à des journalistes, à des médias, de les vérifier et de réinterroger ce que fait l’État.
Cyrille Chaudoit : Un État qui communiquerait sur son bilan ou sur des chiffres, mais avec un rapport tout fait, on peut le lire. Par contre, filer de la donnée brute, on peut en faire autre chose et vérifier qu’on ne nous raconte pas des carabistouilles.
Laure Lucchesi : Exactement.
Mick Levy : Justement. La France a été parmi les pays pionniers de l’open data et sur le podium des pays les plus avancés en termes de data depuis des années et des années. D’ailleurs cette année, depuis quelques semaines, nous sommes à nouveau le premier pays de l’open data. Pourquoi la France s’est-elle lancée dans une telle course ? Quels en sont les enjeux, les avantages ?
Thibaut le Masne : Sommes-nous nombreux dans la course ?
Laure Lucchesi : Nous sommes assez nombreux dans la course. Beaucoup de pays sont évalués dans ces classements. Ces classements internationaux donnent une image et un reflet. Quand la méthodologie ne change pas, ça peut quand même arriver, ça permet aussi, d’année en année, de voir justement des évolutions, à nouveau des fermetures parce que tout cela n’est pas immuable, il y a quand même un vrai sujet aussi.
On a effectivement un certain nombre de classements internationaux qui regardent comment les données publiques sont ouvertes par les administrations, donc, à la fois, quels sont les types de données qui sont mises à disposition, qui sont rendues accessibles, sous quelle forme ; ces données-là sont-elles bien documentées, sont-elles bien réutilisables, sont-elles sur un portail ou une plateforme avec une bonne expérience utilisateur, qui a un certain nombre de caractéristiques. Il y a beaucoup de classements qui sont très complets.
La France ne fait pas forcément la course à la pole position même si c’est toujours agréable !
Mick Levy : C’est sympa d’être en tête !
Cyrille Chaudoit : On aime bien être les premiers de temps en temps.
Laure Lucchesi : Exactement. Encore une fois, quand on régresse, on peut aussi se demander pourquoi, ça dit aussi quelque chose de l’état de la démocratie.
Mick Levy : En même temps, une commission sur l’IA a été commandée par le gouvernement. Elle a remis son rapport [6] il y a quelques jours, rappelons que nous sommes mi-mars 2024, qui dit qu’on ne fait pas assez d’efforts et qu’il faut encore accélérer sur ce sujet de l’open data. J’ai trouvé ça assez étonnant, puisque nous sommes déjà les premiers.
Cyrille Chaudoit : Maintenant il faut le rester ! C’est ça le truc !
Laure Lucchesi : Il y a toujours plus à faire. Il y a quand même beaucoup de données qu’on considère comme des registres ou des données essentielles qui sont déjà disponibles, c’est à ce titre-là que la France est effectivement plutôt bien classée, mais il y a encore d’énormes bases de données, de gisements possibles qui ne sont pas encore ouverts ou qui ne le sont pas avec des qualités suffisantes de mise à disposition. Le travail est donc immense et, à fortiori aussi à l’heure de l’IA où il y a des choses nouvelles qui peuvent s’imaginer.
Mick Levy : Tu nous sers une transition sur un plateau, puisque nous allons retrouver Virginie Matins de Nobrega pour Débats en Technocratie.
Débats en Technocratie – « En ligne comme hors ligne », Virginie Martins de Nobrega
Mick Levy : Alors, Virginie, le vol des données de santé, les violences en ligne, les deepfakes, l’actualité n’en finit plus de montrer des violations de nos droits. Mais, finalement, y a-t-il vraiment des droits en ligne ?
Virginie Martins de Nobrega : C’est sûr que présenté comme ça, on peut en douter. L’univers en ligne peut ressembler au Far-West, notamment s’agissant des droits de l’homme, mais je te rassure, oui, les droits existent. Ce qui peut être plus difficile, en revanche, c’est leur mise en œuvre, leur sanction en cas de violation ou d’abus.
Tu as deux niveaux : au niveau national, il y a les infractions pénales, il y a le droit de la propriété intellectuelle que tous les spécialistes de la PPI [Protection de la Propriété Intellectuelle] du numérique connaissent bien et, au niveau du droit international et réglementaire, tu as le principe qui a été clairement et constamment répété par le Conseil des droits de l’homme des Nations Unies depuis 2012 : les droits hors ligne s’appliquent également en ligne ou, pour le citer in extenso : « Les droits dont les personnes jouissent hors ligne doivent également être protégés en ligne ». Ça vaut pour le respect de la dignité, la liberté d’expression, le droit à la vie privée, la protection des données, l’interdiction de l’incitation à la haine, la non-discrimination, l’égalité, etc. Les droits hors ligne s’appliquent également en ligne.
Mick Levy : C’est une bonne nouvelle. Donc, quand on est sur Internet, on n’est pas dans un autre monde et le droit existe encore. Mais est-ce qu’on va arriver à faire aussi ça avec les IA, parce que j’ai l’impression que tout est en train de partir à vau-l’eau sur le sujet ?
Virginie Martins de Nobrega : Là encore, je pense qu’il faut faire une distinction très claire entre l’existence des droits, leur mise en œuvre et la sanction en cas de non-respect ou de violation de ces droits. Au niveau international et régional, il n’y a pas de doute depuis 2007 : le développement et le déploiement de l’IA et de toutes les technologies ne peut pas se faire en violation et au mépris des droits de l’homme. Par exemple, c’est le cas des biais et des discriminations algorithmiques qui ont été détectées, qui sont suivies et ont clairement été considérées comme une violation des droits de l’homme ; c’est également le traçage avec les malwares ou l’utilisation de la reconnaissance faciale lors de manifestations, de démonstrations sur la voie publique qui ont clairement été identifiés comme non respectueux des droits de l’homme, sauf exception de sécurité d’ordre public.
En France, par exemple, tu ne peux pas avoir de reconnaissance faciale sur la voie publique de manière généralisée, sauf pendant les JO, suite à une exception qui a été validée pour des caméras intelligentes, pendant une période déterminée.
Mick Levy : OK. Là c’est en France, mais comment ça se passe ailleurs dans le monde ?
Virginie Martins de Nobrega : Ce n’est pas forcément le cas partout. En Europe centrale, en Asie centrale, mais aussi dans le sud Caucase, ce sont des pratiques qui sont déjà normalisées, même si les citoyens ne savent pas toujours. C’est aussi la raison pour laquelle on a toujours des discussions et des débats au niveau multipartite, au niveau institutionnel, qui continuent sur ce sujet, non pas sur le principe de l’existence de ces droits, mais comment les protéger effectivement, qui doit les contrôler en sus de certaines autorités nationales de régulation sur des sujets particuliers, notamment la CNIL en France pour les données. Est-ce que ça doit être un système d’autorégulation, est-ce qu’on doit avoir une autorité indépendante, nationale et européenne ? Ce sont toutes ces questions qui, véritablement, agitent aujourd’hui la sphère internationale : on a des droits, mais comment mieux les protéger et comment faire en sorte qu’ils soient effectifs ?
Voix off : Trench Tech. Esprits Critiques pour Tech Éthique.
Le numérique sauvera-t-il le service public ?
Cyrille Chaudoit : On le voit, encore beaucoup de questions. Merci Virginie.
Vingt ans les gars, 20 ans que j’accompagne les entreprises dans leur adaptation à la transformation digitale de notre société.
Mick Levy : Ça ne nous rajeunit pas tout ça !
Cyrille Chaudoit : Sensibilisation, vision stratégique puis déploiement ; en gros, c’est le schéma classique et, en 20 ans, chacun sait qu’on a pourtant perdu quelques acteurs, récalcitrants pour certains, retardataires pour d’autres. On comprend que, face à la digitalisation, l’État ne peut prétendre être un acteur à part, mais son bras armé, l’administration française n’est pas franchement connue pour son agilité, on l’a un peu évoqué.
Au fond, Laure, le service public numérique est-il la promesse d’un avenir meilleur ou un mal nécessaire pour ne pas laisser notre administration s’enliser, encore plus, dans une lourdeur d’un autre âge ?
Laure Lucchesi : C’est ce que je disais tout à l’heure. Il est évidemment critique que le logiciel de délivrance du service public, de sa production, soit mis à jour, à fortiori quand on voit les attentes qu’ont maintenant les usagers qui sont habitués à de l’expérience utilisateur de qualité, à de l’interaction, justement, et à de la réactivité. Le service public ne peut pas être à la traîne en la matière. On n’a donc pas attendu. Ces dernières années et depuis toujours, on a une volonté de passer vers de l’administration électronique, du e-government et ce qu’on a appelé aussi de la transformation digitale.
Ça passe donc par plein de choses différentes. Ça passe, à la fois, par fournir avec, encore une fois, une qualité de service, des services en ligne qui soient vraiment de qualité et qui soient accessibles à tous, ce que je disais. Ce qui fait aussi la différence avec le secteur privé, c’est qu’on ne peut pas choisir ses clients, choisir d’opérer juste sur un segment de marché qui est favorable. On doit vraiment ne pas avoir de fracture et de rupture d’égalité devant l’accès aux services.
Cyrille Chaudoit : Pourtant, justement sur ce point-là, il y a quand même pas mal de personnes qui sont aussi un peu décontenancées par le tout digital et qui ont du mal à aller vers ces démarches en ligne. Comment cela est-il traité ?
Laure Lucchesi : Absolument. C’est un énorme sujet. On estime, aujourd’hui, que 13 millions de personnes sont éloignées du numérique soit pour des questions d’équipement et de connectivité, mais aussi de familiarité avec les usages numériques. Beaucoup d’actions sont mises en place, notamment au travers des maisons France services [7], justement pour inclure ces personnes-là, parce que, aujourd’hui, le canal numérique est l’un des premiers canaux d’accès aux services publics, mais ça ne peut pas être le seul.
On doit donc, aussi, compléter et avoir des capacités d’accéder aux services publics par d’autres moyens.
Il y a effectivement ce gros sujet de l’inclusion numérique. D’ailleurs, petite parenthèse, ce n’est pas forcément intuitif, l’intelligence artificielle peut aussi être une opportunité justement pour inclure plus un certain nombre de personnes dans l’accès aux services publics.
Cyrille Chaudoit : Parce que c’est en langage naturel ? C’est ça ?
Laure Lucchesi : Exactement, le langage naturel, par exemple. On peut citer plusieurs choses. D’abord, effectivement, le langage naturel : on peut traduire en langue française, facile à lire et à comprendre, le langage qui peut, parfois, être un peu jargonnant ou ésotérique.
Thibaut le Masne : Le langage de l’administration française ? C’est ce que tu veux dire ?
Cyrille Chaudoit : Ça peut parfois être aussi pour des personnes qui ne parlent pas français, qu’elles puissent quand même accéder à ces services, notamment à France Travail.
Laure Lucchesi : Absolument. Le sujet de la langue est super important. Ça peut aussi amener des gains de productivité pour les agents qui sont bien des humains, et qui, en fait, arrivent à mieux préparer leurs rendez-vous et à traiter plus de personnes. On voit souvent l’IA comme un facteur d’exclusion, mais ça peut aussi être une opportunité pour plus inclure.
Thibaut le Masne : Du coup, peut-on rappeler quelles sont les principales initiatives qui ont été menées dans ce cercle-là et, surtout, quel rôle l’open data peut jouer dans ces nouveaux services d’État et en quoi ça aiderait les différents clients à avancer ?
Laure Lucchesi : L’open data, on l’a dit, c’est la mise à disposition des données publiques, donc toutes les données qui ne sont ni des données à caractère personnel, j’insiste, ni des données qui sont protégées par des secrets, donc pas de secret médical, pas de secret fiscal, pas de secret commercial.
Cyrille Chaudoit : Ce sont les hackers qui font ça, en général ! C’est de l’open data, mais sur le dark web. C’est comme ça que c’est vendu.
Thibaut le Masne : Ce n’est pas exactement pareil, ce n’est pas si open.
Laure Lucchesi : On a déjà beaucoup de données qui sont rendues disponibles.
Je vais passer par l’exemple de ce qu’on a fait quand je suis arrivé chez Etalab [1], où, d’ailleurs, je ne suis plus. En 2013, on a redéveloppé le portail data.gouv.fr [8]. Quand je suis arrivée à Etalab, cette politique d’open data était en place depuis deux ans, ça a été créé par décret en 2011 et la plateforme, data.gouv.fr, où on a toutes les données mises à disposition par l’administration en open data, existait sous forme de portail dans sa première version. C’était outsourcé à une espèce de SS2I [Société de services en ingénierie informatique] et les administrations étaient plutôt obligées, parce qu’il y avait un décret du Premier ministre, de partager et de mettre à disposition leurs données sur cette plateforme.
Cyrille Chaudoit : Peut-on juste rappeler qu’elles sont les données qui sont mises à disposition sur cette plateforme ?, parce qu’elles sont assez diverses.
Mick Levy : Il y a des centaines de jeux de données ; c’est d’une richesse impressionnante !
Cyrille Chaudoit : Oui, mais juste les grandes thématiques.
Laure Lucchesi : Il y en a dans tous les champs de politique publique et, en gros, dans tous les domaines de tous les ministères.
Ce sont donc, évidemment, toutes les statistiques qui sont produites par l’Insee.
Dans le domaine de l’Insee aussi, ce sont, par exemple, toutes les données de la base qui s’appelle la base Sirene, sur les informations relatives aux entreprises. Et là, on a un fichier de dix millions d’entrées avec les identifiants uniques des entreprises, l’adresse, le chiffre d’affaires. Vous voyez bien que c’est une donnée qui est utile à tout le monde. Elle est produite par l’Insee pour ses usages de statistiques publiques, mais, finalement, elle sert à d’autres administrations, elle est utilisée aussi par des entreprises, puisqu’on peut avoir accès à énormément d’informations.
Thibaut le Masne : Sur ce point-là, alors je sais que ça fait longtemps, enfin ça fait quelque temps que tu n’y es plus, tu n’as donc pas forcément les chiffres exacts, mais est-ce que tu peux rappeler le nombre de personnes qui arrivent à se connecter ou le nombre d’entreprises ? Est-ce que vous faites des statistiques sur les gens qui utilisent cette plateforme-là ?
Laure Lucchesi : Sur data.gouv.fr [8] ? Toutes les statistiques, en fait c’est plus que des statistiques, ce sont des données d’utilisation en temps réel, sont disponibles, puisque ça fait partie aussi des engagements de transparence qu’on a mis en place. Vous avez le nombre de ce qu’on appelle datasets, de jeux de données effectivement disponibles. Là, à cet instant il y en a 47 699.
Cyrille Chaudoit : Je suis sur le site, juste pour que vous compreniez bien ce qu’on trouve, allez sur le site c’est vraiment intéressant, les thématiques à la une, juste pêle-mêle, comme ça : les données sur le Covid-19, sur les élections, sur les énergies, sur les données géographiques, l’éducation, logement et urbanisme, transport, emploi, santé, l’agriculture et l’alimentation, etc., j’en passe et des meilleurs. Bref, c’est hyper riche.
Mick Levy : Les données en open data sont d’ailleurs devenues un incontournable de tout projet qu’on peut réaliser en data science dans des entreprises. Du coup, ça permet de contextualiser les constats qui sont faits par les données de l’entreprise sur ses propres ventes, sur sa propre performance, de les contextualiser par rapport à un contexte plus large.
Laure, j’ai aussi envie de faire un petit peu poil à gratter. N’y a-t-il pas eu un mauvais effet de l’open data : ça a servi à la fois à des entreprises, je viens de l’illustrer, ça sert à la fois à la vie publique, rappelons que l’open data est aussi régie par une loi sur la transparence de la République [loi pour une République numérique de 2016, NdT], mais, finalement, est-ce que ça n’a pas aussi fait le jeu des Big Tech ? Du coup, un Google et tous les autres ont pu accéder à tout un tas de données et eux ont des compétences, un savoir-faire pour exploiter ces données, peut-être bien plus important que ceux qu’on a dans l’administration française ou, même, parfois dans les entreprises. Du coup, finalement, est-ce que ce ne sont pas eux, les Big Tech, qui en ont eu les premiers l’avantage, l’usufruit on pourrait dire, à utiliser ces données ?
Laure Lucchesi : Évidemment qu’ils utilisent, comme tous les autres, les données qui sont mises à disposition en open data. Mais, un des paris qui a été fait sur l’open data, c’est justement de réduire les barrières et les inégalités entre les acteurs et donner la possibilité à des plus petits acteurs d’avoir aussi accès à ces données-là, parce qu’ils n’auraient pas les moyens soit de les acheter soit, même, de les reconstituer et de les reproduire.
Si on parle, par exemple, des données sur l’infrastructure de transport qui, pour le coup, est une vraie infrastructure numérique de données. Quand on a tout le réseau de transports en commun qui est disponible, on voit bien que c’est le socle sur lequel des applications de calculateurs d’itinéraires vont venir se greffer. On a aussi des données sur les horaires.
Mick Levy : Google Maps en a profité pour donner les horaires des transports et puis indiquer un transport, mais c’est aussi le cas de toutes les villes de France qui peuvent s’appuyer là-dessus pour chacune, proposer ses applications liées à ses transports en commun.
Laure Lucchesi : Et à des plus petits acteurs, justement que Google, de venir concurrencer et fournir, eux aussi, ces données-là.
Mick Levy : C’est d’ailleurs une belle illustration de ce qu’on disait tout à l’heure, je fais le lien, sur la notion d’État plateforme. L’État ouvre des données qui servent à plein d’autres personnes et ce n’est pas l’État qui a fourni l’application elle-même pour réserver ton transport et savoir à quelle heure il faut que tu prennes ton bus.
Laure Lucchesi : Exactement.
Cyrille Chaudoit : Du coup, ça pose une question. Tu nous as dit toi-même, tout à l’heure, que cette donnée publique a déjà été financée, autrement dit par le contribuable. Cette donnée est donc mise en pâture à tout le monde, y compris à des Big Tech qui vont utiliser cette techno pour nous vendre quelque chose derrière et, parfois même, ils ne vont pas nous le vendre, ça sera gratuit, on connaît la suite de l’adage. C’est quand même un petit peu délicat, comme mécanique, sur le fond ?
Laure Lucchesi : Ça a été tout le débat, qui est toujours en cours, sur la monétisation des données publiques. Dans l’histoire, on a eu aussi des mouvements de balancier. À un moment, on disait « c’est le patrimoine de données des administrations, le patrimoine immatériel, donc, administrations, il faut que vous vendiez, que vous créiez des services qui soient, pour vous, des ressources propres sur lesquelles vous allez vendre des services ». Les administrations se sont mises à vendre des données brutes et, en fait, ce n’est pas leur métier de savoir vendre des données, elles le faisaient mal, elles le faisaient selon des modèles qui ne sont pas les modèles de l’économie numérique. Un rapport a été écrit en 2013 là-dessus et on voyait que les coûts de transaction et les coûts de coordination étaient, finalement, supérieurs à ce que l’administration pouvait récupérer de ses données.
Un des paris de l’open data c’est surtout de dire que ça va créer de la valeur économique sur laquelle l’administration récupérera une partie par l’impôt. Ça va permettre de créer de nouveaux services, on en récupérera une partie, ça va même, potentiellement, permettre de créer jusqu’à des emplois et on s’y retrouvera avec l’impôt. La vraie question c’est que si des acteurs ne jouent pas le jeu de payer leurs impôts, là, on a effectivement un sujet, mais qui n’est pas le sujet de l’open data et qui se règle certainement à un autre niveau.
Cyrille Chaudoit : On est bien d’accord. C’est systémique et, en matière de système, du rôle de l’open data et de l’action publique par le numérique, c’est précisément ce qu’on va aborder dans la toute prochaine séquence.
Mais, juste avant, on va retrouver avec grand plaisir, Fabienne Billat et son Patch Tech.
Le Patch Tech de Fabienne Billat
Cyrille Chaudoit : Le 14 février 2024, c’était la Saint-Valentin, comme chaque année, mais c’était aussi OpenAI qui donnait naissance à une révolution dans le domaine de la création vidéo avec le lancement de Sora. Allez, Fabienne, dis-nous tout.
Fabienne Billat : Oui, tout à fait. Déjà, Sora c’est un nom japonais qui a été choisi et qui évoque le ciel ou le paradis, car il ouvre la voie à des possibilités inédites dans la production de vidéos. Cette production, limitée pour le moment à 60 secondes, est initiée par des prompts, c’est-à-dire une instruction écrite. Voilà un bond technologique, comparable à celui que nous avons connu avec la génération d’images il y a plus d’un an, et tu t’en souviens.
Sora utilise une architecture de transformateur et se distingue par sa capacité à créer des scènes riches et réalistes avec plusieurs personnages, des mouvements complexes de caméra et une multitude de détails précis, tout cela dans une grande cohérence. Néanmoins, tu as pu observer, vous avez pu observer que le modèle présente des faiblesses au niveau des doigts, des bras ou des jambes, et peut ne pas comprendre des cas spécifiques de cause à effet. Par exemple, une personne peut croquer dans un biscuit, mais le biscuit reste entier !
Cyrille Chaudoit : OK. Encore plus de créativité au bout des doigts ou du biscuit, mais est-ce que ça va vraiment plaire à tout le monde ?
Fabienne Billat : On peut déjà imaginer à quel point cela bouleversera les processus créatifs et de conception vidéo traditionnels, mais également raviver les inquiétudes des syndicats d’acteurs américains, déjà en grève en novembre 2023. Selon les prévisions de Forrester, d’ici à 2030, 90 % des blockbusters américains seront produits à l’aide de l’IA générative. Hormis la production cinématographique, artistique, culturelle, publicitaire, ces vidéos immersives offriront la possibilité de produire rapidement du contenu, que ce soit, par exemple, dans la formation, l’éducation, le marketing, etc.
Cyrille Chaudoit : Je donne quand même rendez-vous en 2030 à Forrester qui cherche, avant tout, à vendre des études. Mais question sécurité, authenticité, copyright, qu’en est-il ?
Fabienne Billat : Justement, OpenAI a donc mis en place une Red Team de personnalités triées sur le volet — des réalisateurs, des artistes experts dans le domaine de l’IA —, afin d’y déceler des dangers ou des risques en matière de deepfakes, d’usurpation d’identité.
Autre promesse, celle de garantir la fiabilité des contenus générés, en envisageant l’intégration de métadonnées, des filigranes appelés watermarks pour faciliter leur vérification. À ce sujet, la CNIL italienne, le GPDP [Garante per la protezione dei dati personali] a ouvert une enquête, début mars, sur différentes modalités, comme les données, l’entraînement des algorithmes, et donne un délai de 20 jours à OpenAI pour y répondre.
Pour autant, la concurrence reste vive et Google, Meta et d’autres sont lancés dans la course. Mais, ce qui pourrait faire toute la différence pour Sora, c’est la combinaison d’un bon timing et d’importantes capacités d’investissement.
À l’instar de ma conviction sur les contenus informationnels, le photojournaliste Niels Ackermann soulève une réflexion stimulante : selon lui, plus il est facile de produire du faux, plus le vrai aura de la valeur.
Avec cette profusion d’images créées depuis un an, lisses, égales, pouvons-nous anticiper une revalorisation du vrai où les œuvres réelles, vécues, parfois moins parfaites, offriraient une alternative à l’abondance de ces contenus si synthétiques ?
Voix off : Trench Tech. Esprits Critiques pour Tech Éthique.
Données libres pour société plus éclairée
Cyrille Chaudoit : En voilà des grandes questions, Fabienne !
On a compris la démarche et l’utilité de l’open data qui vise à faciliter l’accès aux données publiques : pour plus de transparence, pour permettre à chacun d’innover à partir de cette matière première, l’esprit de l’open innovation, en somme, pour aller plus vite et plus loin ensemble, super ! Mais Laure, en quoi la data serait-elle un bien commun comme un autre ? Et en quoi l’open data contribuerait-elle, alors, à une société plus démocratique ?
Laure Lucchesi : J’ai souvent l’habitude de dire que l’open data c’est un peu la Déclaration des droits de l’homme et du citoyen à l’heure d’Internet. Dans l’article 15 de la Déclaration des droits de l’homme et du citoyen, on dit « la société est en droit de demander compte à tout agent public de son administration. » Avant, il fallait aller à un guichet, aller contacter une administration pour avoir accès aux papiers qu’elle avait dans ses tiroirs, être autorisé à faire des photocopies. À partir du moment où on met de façon proactive et spontanée des données qui sont exploitables, utilisables, analysables, on donne du pouvoir d’agir aux citoyens ; on peut réinterroger l’action de l’État. On voit bien que la révolution numérique change complètement la donne. Je reviens quand même sur un petit passage historique aussi : il faut se souvenir qu’en 1978 on a eu deux lois qui sont assez fondatrices, la loi Informatique et Libertés [9]que tout le monde connaît, et une autre loi sur l’accès aux documents administratifs [10]. Ça a donné, justement, cette capacité, à des citoyens, d’aller accéder aux informations qui étaient produites dans le cadre de leur mission ou reçues dans le cadre de leur mission par des administrations. C’était donc déjà une façon de donner du pouvoir d’interroger et de consulter ce que faisait l’État. Et, à partir du moment où on accède aux données, on a beaucoup plus d’empowerment, comme on dit en bon français, des citoyens.
Les données qu’on met à disposition sont accessibles par tout un chacun et ça peut être aussi, on l’a vu par exemple pendant le Covid, Guillaume Rozier qui avait justement une facilité à créer des tableaux de bord, à analyser ces données et à les rendre utiles.
Mick Levy : Rappelons que Guillaume Rozier a fait CovidTracker [11].
Cyrille Chaudoit : Une illustration qui parle à tout le monde.
Mick Levy : D’ailleurs, s’il nous entend, j’adorerais qu’on puisse recevoir Guillaume Rozier qui, rappelons-le, travaille maintenant à l’Élysée. Il est au service de l’État.
Cyrille Chaudoit : Guillaume, tu es le bienvenu dans Trench Tech. Le message est passé.
Thibaut le Masne : Je voulais rebondir sur ta formulation, Laure, que je trouve absolument géniale : l’open data est la Déclaration des droits de l’homme à l’heure d’Internet. C’est absolument formidable, je trouve que c’est super. Quelque part, il y a aussi un deuxième axe que tu soulignes très bien : on passe d’un système réactif à un système proactif et je sais de quoi je parle. Pour le coup, c’est vraiment quelque chose de bien. Mais est-ce qu’on arrive à se saisir, en tant que citoyen, de cette proactivité ? Est-ce qu’on arrive à se saisir de tout ce bien commun qui est mis à notre disposition ?, en dehors de Guillaume Rozier qui arrive à bien le faire.
Laure Lucchesi : C’est ce que j’allais dire. Tout à l’heure, on parlait de littératie numérique. On n’a pas forcément, toutes et tous, toutes les facilités et tous les outils pour aller exploiter nous-mêmes ces données-là, mais, franchement, il y a quand même des choses qui sont vraiment très faciles. On n’a pas dit que sur la plateforme data.gouv.fr, il n’y a évidemment aucune restriction, c’est un des principes de l’open data, pour accéder à ces données, les télécharger et les utiliser. Vous n’avez pas à vous identifier, vous n’avez pas à vous créer un compte, vous les prenez, vous les téléchargez sous forme de fichiers.
Cyrille Chaudoit : C’est l’open bar de la data.
Laure Lucchesi : Sous forme d’API pour d’autres usages. Dans une optique d’utilisation individuelle, il n’y a pas de restrictions et c’est un des principes très fort de l’open data.
Bien sûr que tout le monde ne s’en saisit pas, c’est là où on a aussi un rôle de médiation très important, qui doit être fait justement par la presse, par des data journalistes ou, typiquement, par des associations de la société civile qui vont aller creuser, chercher des données, et on en a beaucoup qui savent justement utiliser les données mises à disposition en open data pour aller faire du plaidoyer ou appuyer un certain nombre de leurs actions.
L’idée, c’est aussi d’engager un dialogue qui peut être confrontationnel avec, aussi, l’extérieur et de fournir un contre-pouvoir démocratique, mais aussi, et j’insiste parce que c’est un autre axe qui est important, rendre l’administration plus dialoguante et réduire la distance entre l’État et les citoyens. Il y a non seulement un côté où on rend compte, en tant que l’administration, de notre action, mais il y a aussi un autre aspect qui est qu’on rentre dans un dialogue, qu’on est capable, justement, d’identifier là où, par exemple, les données ne sont pas de qualité suffisante et de voir comment on pourrait les compléter. C’est de la participation à la construction.
Cyrille Chaudoit : De la coconstruction.
Laure Lucchesi : Exactement, j’allais le dire, la coconstruction du service public.
Je voulais aussi souligner que quand on est entré dans cette démarche d’open data en 2012/2013, en fait, notre idée était plus large, c’était un peu un pied dans la porte pour conduire, engager, impulser tout un changement culturel et organisationnel de l’administration. C’était donc à la fois, justement, la rendre plus participative, plus collaborative, apprendre à travailler en écosystème ; c’était aussi ré-internaliser des compétences y compris sur l’usage de l’open source, par exemple le fait de mettre la plateforme data.gouv.fr [8] en open source alors qu’elle n’était pas avant.
Cyrille Chaudoit : C’est aussi un mindset, ça vient envoyer un signal.
On imagine bien le changement culturel que vous avez impulsé et aussi ce que ça a provoqué chez celles et ceux qui ont dû suivre le mouvement, ce n’était peut-être pas si simple que ça. J’ai une question plutôt sur le rôle de tout ça de façon systémique, on l’a évoqué rapidement tout à l’heure. À l’heure d’une société qui baigne dans la technologie et le numérique, à l’heure d’une société qui baigne dans l’information, est-ce que, finalement, l’open data, pour un État, c’est une forme de nouvelle infrastructure qu’il faut à tout prix mettre à disposition, gérer, pour éviter que ce soit d’autres qui la gèrent à sa place ?
Laure Lucchesi : Exactement, ça en fait partie et la référence à l’open source est aussi à propos.
L’open data c’est : on rend disponibles toutes les données qu’on peut ouvrir et partager. On sent bien que toutes les données n’ont pas non plus la même valeur d’usage et que certaines sont critiques, parce que, notamment, elles contiennent des identifiants uniques, donc elles sont critiques pour la société et l’économie. On a parlé tout à l’heure de la base de données Sirene sur les entreprises et leurs identifiants, on sent bien le rôle central que cette donnée-là a pour des administrations et pour n’importe quelle entreprise qui a affaire à des clients, à des fournisseurs.
Cyrille Chaudoit : Rappelons que le numéro Siren, c’est l’identifiant unique des entreprises, Siren, Siret.
Laure Lucchesi : Exactement. L’identifiant unique des entreprises, donc, cette donnée-là a une très forte valeur.
Un autre exemple, ce sont les données du cadastre, le cadastre vectorisé est une des données les plus téléchargées sur data.gouv, pareil on sent bien que c’est un socle.
Les données aussi d’adresses. On a créé une base de données d’adresses géolocalisées. On voit bien que c’est une donnée qui est critique à la fois pour le e-commerce, pour que votre colis arrive bien dans votre boîte à lettres, mais aussi pour sauver des vies parce que des services de secours qui doivent accéder pour un accident à un endroit, sur un chantier, dans une zone reculée, ont besoin de savoir tout de suite où aller et c’est évidemment au cœur de tous les usages de GPS. Ces données-là ont une valeur d’usage très forte.
On a donc introduit, dans la loi pour une République numérique [12], cette notion de donnée de référence et service public de la donnée. Autant les administrations mettent les données en open data au fur et à mesure de leur production, mais il y a certaines données qui sont régies par des obligations spécifiques et elles doivent être accessibles à tout moment, parce que, justement, c’est une infrastructure essentielle.
Je crois que c’est vraiment un rôle de la puissance publique du 21e siècle de construire cette infrastructure et de la rendre accessible et capacitaire, parce qu’on voit bien, typiquement, que toutes ces données-là, c’est le socle sur lequel se bâtissent les services publics et privés.
Cyrille Chaudoit : Dit autrement, juste pour l’image, par le passé les pays qui avaient les plus grands réseaux ferrés ou les plus grands réseaux autoroutiers étaient des pays qui étaient particulièrement avancés parce que ça favorisait, par le déplacement, notamment le commerce et tout un tas d’autres choses. Là, tu es en train de nous dire que les pays qui auront le plus maillé leur infrastructure numérique publique en open source et avec l’open data, seront les pays qui prendront un temps d’avance sur les autres ?
Laure Lucchesi : Exactement. Le rôle de la puissance publique, le rôle de l’État dans le numérique, c’est une prolongation du rôle qu’il a dans le monde physique. Il y a un certain nombre d’endroits où l’État opère soit parce que, justement, il n’y a pas de marché et il a une obligation de fourniture de services essentiels ; il intervient pour réguler, il intervient pour empêcher l’extraction de rentes ou la captation de valeur par des acteurs monopolistiques. C’est la même chose sur les infrastructures numériques.
Donc, fournir des données, fournir des API, fournir du code source de logiciels, opérer des services d’identité ou de paiement, c’est le cœur de ce qu’on appelle l’infrastructure publique numérique qui est essentielle dans l’action de la puissance publique du 21e siècle et qui devient même, d’ailleurs, un nouveau front de la géopolitique mondiale. On a des pays qui ont bâti des positions très fortes et qui en font un champ d’influence, de rayonnement et de construction de pouvoir à l’échelle mondiale sur la base de cette infrastructure publique numérique.
Après, la question qui est fondamentale, c’est de savoir si, effectivement, la fourniture de cette infrastructure est au service d’une émancipation démocratique ou, au contraire, d’un refermement et d’un contrôle plus totalitaire, quel est le projet politique derrière. On a un certain nombre de garde-fous qu’on peut placer, notamment pour de nouveau transposer une gouvernance démocratique dans cette infrastructure publique numérique, et c’est un débat qui doit être posé aujourd’hui.
Mick Levy : Laure, j’annonce tout de suite qu’il y a un peu un combat entre nous. On a tous plein de questions à poser. Bon, j’annonce, j’en ai deux d’affilée, j’ai deux questions.
Cyrille Chaudoit : Les questions, ce n’est pas open bar !
Mick Levy : Je réserve deux questions, n’allez pas me les piquer.
Les deux questions sont un peu projectives, Laure, du coup. Première question : quelle évolution vois-tu sur l’open data et son impact sur la société, à l’heure où on voit un tel envol de l’IA qu’on connaît depuis quelque temps ?
Laure Lucchesi : C’est la première question ? Je réponds à la première.
Pour l’open data, d’abord, il faut quand même garantir qu’il n’y a pas à nouveau de fermetures dramatiques, parce que ça pourrait arriver. Pour le coup, en regardant dans les classements internationaux, on voit qu’il y a un certain nombre de pays où ça se referme.
Mick Levy : C’est une notion qui est encore à risque, en fait.
Laure Lucchesi : Même quand on a une contrainte légale, vous savez bien qu’on la respecte plus ou moins bien, donc voilà. Il y a eu des visions politiques, un portage de ce sujet qui a été variable dans le temps, en France comme dans d’autres pays. Je formule le vœu que vraiment on ne revienne pas en arrière.
Mick Levy : Il faudrait mettre l’open data dans la constitution, en fait.
Laure Lucchesi : Dans la constitution, je ne sais pas. En tout cas, je redis que des principes sont déjà posés dans une certain nombre d’endroits. On a quand même un cadre légal, français et européen, qui, aujourd’hui inclut cette notion. Il y a une directive à l’échelle européenne, pas très connue, qui s’appelle Public sector information directive [13], qui, justement, s’est inspirée de la loi pour une République numérique de 2016 [12] et qui impose cet open data à l’échelle européenne, dans une optique de « on va avoir un marché et une fluidité à l’échelle de l’Europe ». Elle met notamment des obligations sur certaines données qui sont considérées à forte valeur : les données environnementales, les statistiques publiques, évidemment, les données météo par exemple. Un certain nombre de données doit être rendu disponible à l’échelle européenne.
Cyrille Chaudoit : Finalement, là, tu nous donnes deux sujets :
premier sujet, il faut défendre l’open data parce que ce n’est peut-être pas gagné pour les années à venir ;
deuxième sujet, l’étendre et c’est en route, côté européen.
Tu avais une troisième idée là-dessus ?
Laure Lucchesi : L’autre sujet, c’est justement de continuer aussi avec la mise à disposition de certaines données par API, pas seulement en téléchargement mais avec un doublé pour que ça puisse être utilisé par des services numériques. Et puis continuer à ouvrir parce que, en fait, on a souvent dit que la donnée c’est le pétrole du 21e siècle.
Thibaut le Masne : C’est l’or noir.
Laure Lucchesi : Je combats cette idée, parce que, justement, le pétrole c’est une ressource finie ; ce qui est magique avec la donnée, c’est que plus il y a de services numériques, plus il y en a. D’où l’idée que ce sont aussi ceux qui vont savoir en tirer de la valeur, qui sortiront gagnants du jeu. Là où l’image est juste c’est qu’effectivement c’est un actif stratégique et que les organisations qui, encore une fois, sauront le valoriser en sortiront gagnantes. Juste un dernier mot.
Cyrille Chaudoit : En sortiront gagnantes et l’État aussi.
Laure Lucchesi : Exactement. Pour moi, l’avenir de l’open data c’est d’aller vers les communs numériques [14], donc des ressources numériques, partagées, gouvernées de façon justement communautaire.
Mick Levy : Super. Tu me fais un pont d’or pour ma deuxième question. Maintenant qu’on a beaucoup travaillé sur cette infrastructure de données ouvertes, est-ce que le prochain step ce n’est pas d’avoir une infrastructure d’algorithmes, d’IA, ouverte, peut-être portée aussi par le gouvernement, une sorte d’open AI, IA ouverte, plutôt, en français, mais gouvernementale.
Laure Lucchesi : Il y a plein de formes différentes des communs numériques, ça peut être des données, ça peut être des codes de logiciels, ça peut être plein de choses.
Cyrille Chaudoit : On fera un épisode spécial communs numériques bientôt.
Laure Lucchesi : Super. Je l’écouterai avec attention. C’est un sujet qui commence tout juste à être abordé, à monter dans les agendas politiques, qui n’est pas facile à opérationnaliser : faire fonctionner un commun et avoir la bonne gouvernance !
Mick Levy : Réponds-moi plus spécifiquement sur l’IA : est-ce qu’il faut faire quelque chose ? Est-ce qu’il faut faire une histoire gouvernementale pour avoir des algos qui servent à tous, et, pareil, une espèce d’algo-plateforme, je ne sais pas comment dire ?
Laure Lucchesi : Il y a plusieurs choses. Il y a des éléments dans le rapport [6] qui a été remis au président Macron, il y a quelques jours, sur ce sujet-là. L’administration peut effectivement travailler, comme elle a commencé à le faire, sur des modèles de langage qui soient justement adaptés aussi aux usages administratifs et qui intègrent un certain nombre de garanties en termes de traçabilité des sources, de transparence, d’auditabilité et d’ouverture ; c’est une première chose. On pourrait aussi imaginer que certaines bases de données, justement les fameuses données d’apprentissage, soient créées par la puissance publique et gouvernées comme des communs numériques.
À Etalab [1] on avait commencé, dès 2019, à travailler sur des bases de données de questions-réponses en langue française, parce que, dans le débat sur l’IA, on a aussi cette question de la langue française, ce n’est pas à vous que je vais le dire : l’IA, c’est évidemment le reflet et même la loupe d’un certain nombre de valeurs, donc, finalement, la langue française est un énorme sujet. On avait commencé à faire ça. Beaucoup de choses vont pouvoir être développées en la matière. On parlait aussi, tout à l’heure, de biais algorithmiques, j’imagine des bases de données qui soient égalitaires, dont on garantit qu’elles sont sans biais, mises à disposition de tous pour qu’elles puissent être utilisées et on peut réfléchir à ce que serait un service public de l’IA ; c’est une question à se poser.
Cyrille Chaudoit : C’est magnifique de recevoir Laure parce qu’elle nous fait les transitions toutes trouvées. Depuis tout à l’heure, une question me brûle les lèvres et tu le sais bien parce que quand on a pris contact ensemble c’était juste après un post sur Linkedin qui traitait de ces sujets-là, entre autres : peut-on envisager tout ce dont on parle depuis tout à l’heure comme un facteur d’inclusion.
Laure Lucchesi : Oui, évidemment. En particulier, avec l’intelligence artificielle, il faut être extrêmement vigilant pour qu’elle n’accroisse pas les risques, les inégalités, pour qu’elle ne soit pas non seulement le reflet mais la loupe des biais qui existent déjà dans nos sociétés, il y a énormément d’exemples. Si on prend le sujet de la parité, je pense que l’IA peut aussi être une opportunité pour simplifier des tâches en particulier dans les emplois qui sont très féminisés et très administratifs avec beaucoup de paperasse. Il y a des gains énormes qui vont alléger la charge sur les agents. Il y a un exemple très parlant avec un logiciel qui s’appelle inaSpeechSegmenter [15], qui permet de mesurer les temps de parole très finement, comme ça n’a jamais pu être fait.
Cyrille Chaudoit : Ça irait bien pour Trench Tech !
Mick Levy : C’est là qu’on révélera au grand jour que c’est Cyrille qui parle le plus dans le podcast.
Cyrille Chaudoit : On sait tous que c’est Thibaut !
Laure Lucchesi : Ça permet aussi de factualiser un certain nombre de choses qu’on ne pouvait pas mesurer avant, donc d’agir.
Cyrille Chaudoit : Je pensais surtout à la donnée, le fait que la donnée ait été raffinée et fact-checkée, parce qu’elle est rendue publique et open.
Laure Lucchesi : Bien sûr. J’ai parlé de beaucoup de liens, mais le fait qu’on mette à disposition ces données, c’est une façon de renforcer la participation citoyenne, d’inclure plus dans la production du service public. Quand je vous disais, tout à l’heure, que ces données sont aussi à la base d’un dialogue entre les administrations qui les produisent et ceux qui s’en servent, c’est donc aussi une sorte de coconstruction du service public et d’amener à plus de participation, y compris à la vie démocratique.
Thibaut le Masne : Merci Laure.
Mick a posé ses 48 questions, je ne peux pas te laisser sans avoir posé la dernière question, puisque, au final, c’est la question phare. Tu ne nous as pas dit : quelle est ta plus grande fierté chez Etalab ? Quel est ton projet phare ? Peut-être de data woman chez Etalab ?
Laure Lucchesi : Ma grande fierté, chez Etalab [1], c’est que je crois qu’on a contribué à construire une nouvelle manière de faire du service public, avec une administration qui soit quand même plus ouverte sur l’extérieur, plus dialoguante ; qu’à un certain nombre d’endroits on a stimulé la démocratie en donnant du pouvoir d’agir, c’est quelque chose dont je suis très fière. Mes équipes, à la fois à l’intérieur de l’administration et à l’extérieur de l’administration, étaient aussi extrêmement engagées. Il y avait vraiment une conviction et un engagement extrêmement forts dans ce qui était fait.
Mick Levy : C’est effectivement une belle mission.
Thibaut le Masne : Ça fait chaud au cœur parce que c’est exactement ce que l’on imagine en tant que citoyen : être la motivation des personnes qui sont à ces postes-là. Ça fait du bien de l’entendre.
Merci, Laure, pour cet échange très instructif et constructif également.
Je rappelle qu’on te trouve évidemment sur Linkedin, entre autres, je l’ai glissé tout à l’heure et aussi sur Give & Tech [16], la nouvelle initiative que tu partages avec ton associée, Laurence Chrétien, c’est-à-dire faire travailler ensemble les entreprises pour accélérer leurs transformations « Data, IA et Digitales ».t.
Mais vous qui nous écoutez, restez avec nous pour les cinq dernières minutes de cet épisode. C’est l’heure du debrief.
Cyrille Chaudoit : Merci beaucoup Laure.
Mick Levy : À bientôt laure, salut.
Laure Lucchesi : Merci à tous les trois, à bientôt.
Voix off : Trench Tech. Esprits Critiques pour Tech Éthique.
Le debrief
Cyrille Chaudoit : Eh bien voilà mes petits amis, encore un très bel épisode à mettre au compte de Trench Tech. Mick, qu’en as-tu pensé ?
Mick Levy : Une belle phrase quand même : « L’open data c’est la Déclaration des droits de l’homme et du citoyen à l’heure d’Internet », je trouve ça hyper inspirant.
Cyrille Chaudoit : Elle est vraiment belle.
Mick Levy : Ça montre aussi ce que j’adore très souvent chez nos invités, les gens qui portent des convictions. Elle a des convictions très fortes autour de ce sujet-là qu’elle a réussi à mettre en musique et à rendre concrètes chez Etalab.
Thibaut le Masne : J’aime vraiment ce concept de passer d’un système réactif à un système proactif. Je trouve que c’est bien avec, en plus, tout ce qui est notion de transparence quand c’est l’État qui met à disposition, ça rassure et ça permet, justement, d’avoir cet État transparent, pas transparent dans le sens absent, dans le sens où il dit ce qu’il fait et c’est plutôt vrai.
Cyrille Chaudoit : Tout simplement. Je dois vous confesser un truc : j’avais un peu raté l’idée selon laquelle c’était à ce point systémique, ça me semblait un peu un peu sympa de mettre à disposition de la donnée, comme ça, gratuite et tout ça. En réalité, la deuxième face de la pièce, ce que tu viens de nous rappeler, cette Déclaration des droits de l’homme et du citoyen à l’heure d’Internet, en fait, c’est le rôle d’infrastructures et ça joue au niveau de l’État. On a bien compris avec ce parallèle avec les réseaux ferrés, les réseaux autoroutiers, que des pays étaient en avance sur d’autres parce qu’ils avaient mis en place ces infrastructures, ils avaient fait les investissements nécessaires et puis, surtout, ils les géraient, ce n’était pas laissé à la main de n’importe qui. Et là, aujourd’hui, ça se fait avec la data.
Thibaut le Masne : On peut rappeler que pour toutes les entreprises il y a le site data.gouv.fr sur lequel on retrouve une masse d’informations absolument incroyable.
Mick Levy : Pour toutes les entreprises, mais aussi pour Mme Michu si elle a la curiosité d’aller voir comment ça se passe ; une marketplace, une place de marché de données ouvertes, c’est passionnant.
Cyrille Chaudoit : Aujourd’hui, avec le no-code, tu peux aller récupérer des data sur la météo, tu te fais une petite application qui va, pourquoi pas, devenir la killer app de demain
Mick Levy : Parlons un tout petit peu d’usages, il y en a un que j’adore, qui n’a pas été cité : les données des transactions immobilières ont été ouvertes sur Internet, c’est assez récent, il y a un an, un an et demi, moins de deux ans en tout cas. Du coup, ça permet de beaucoup mieux comprendre le marché l’immobilier, d’ailleurs de mieux négocier, aussi, quand on fait des achats et d’avoir vu fleurir tout un tas de moteurs d’estimations immobilières qui se basent très majoritairement sur ces circuits de data.
Cyrille Chaudoit : Complètement, il y a un circuit qui date d’il y a plus longtemps que ça, c’est app.dvf.etalab.gouv.fr [17]. Vous pouvez aller repérer les maisons à côté de chez vous, savoir combien elles ont été vendues et ça vous permet de vous aligner sur les prix.
Mick Levy : Tout ça, c’est super chouette. Elle nous a quand même a donné un autre message qui m’a un peu surpris : rien n’est acquis. C’est comme une grande avancée citoyenne qu’il faut continuer de défendre, ce n’est pas acquis. Si certains partis politiques venaient au pouvoir, ils pourraient vouloir revenir sur ce droit de données ouvertes et de transparence de la vie publique, parce que ce sont ces notions-là qui sont derrière. Il faut continuer de combattre.
Thibaut le Masne : C’est un truc sur lequel on est peu resté, c’est un message hyper important, à se demander s’il ne faudrait pas que ça rentre aussi dans la constitution, à un moment donné.
Mick Levy : J’ai effectivement fait le parallèle, toutes proportions gardées, évidemment, avec le droit à l’IVG qui vient de rentrer dans la constitution.
Thibaut le Masne : On ne parle pas des mêmes sujets, bien sûr, ce n’est pas pareil. Mais, protéger ça, protéger ce droit systémique et ces infrastructures, ça semble quand même cohérent, à un moment donné, de l’ancrer et de le sanctuariser.
Cyrille Chaudoit : Tout à fait.
Mick Levy : De l’étendre aussi en Europe. Il y a, évidemment, une forme de compétition internationale. En plus, on l’a dit, la France court en tête dans cette compétition, c’est génial, c’est une forme de phare. Je trouve que c’est intéressant parce que c’est très aligné avec nos valeurs françaises et aussi avec nos valeurs européennes. On parle souvent de l’Europe qui n’utilise que la réglementation comme outil de leadership, mais là, on voit aussi du concret.
Thibaut le Masne : Et c’est un vrai point, en fait, sur l’open data qui est un contre-pied de ce que font les Américains, c’est-à-dire qu’avec l’open data c’est vraiment le citoyen qui est mis au centre de l’échiquier et non plus le consommateur ; c’est cela qui change aussi un peu la donne.
Cyrille Chaudoit : Et voilà, vous venez de passer plus ou moins 60 minutes en notre compagnie à exercer votre esprit critique sur les enjeux de l’open data pour un numérique public plus fort, au service de nos enjeux démocratiques. On espère que cet épisode avec Laure Lucchesi vous a plu et qu’il a, une nouvelle fois, permis d’exercer votre esprit critique pour une tech éthique. Et, si c’est le cas, n’oubliez pas, postez un avis cinq étoiles sur Apple podcast ou Spotify, levez un pouce sur YouTube et partagez cet épisode autour de vous, ça nous donne une motivation de fou pour vous sortir plein d’autres épisodes et ça prend quoi ?, allez, une seconde. Et souvenez-vous de ce que disait Forrest Gump : « La vie, c’est comme une boîte de chocolats, on ne sait jamais sur quoi on va tomber ! ». Avec l’open data, vous pourriez bien trouver de quoi rendre notre quotidien plus savoureux !