L’utilisation des données dans l’Éducation nationale L’École du futur

Quel est le rôle et la place de l’open data dans l’Éducation nationale ?
NB : deux parties de l’émission ne sont pas transcrites.

Philippine Dolbeau : Bonjour à toutes et à tous et bienvenue dans l’École du futur.
[…]
Qu’elles soient brutes ou traitées par des outils pour en simplifier la lecture, les données permettent de nous éclairer, oui, d’anticiper des situations, aussi, mais aussi et surtout de répondre à des enjeux de souveraineté et d’amélioration du service public et c’est notamment le cas dans l’Éducation nationale. On en parle avec notre invité Philippe Ajuelos. Bonjour Philippe.

Philippe Ajuelos : Bonjour.

Philippine Dolbeau : Bienvenue sur ce plateau, nous sommes ravis de vous avoir. Vous êtes administrateur ministériel des données, des algorithmes et des codes sources au sein de la Direction du numérique pour l’éducation [1]. Ce sont des termes un peu complexes dont on va parler dans un instant, vous allez le voir, c’est promis, on va les décrypter juste après le focus.

[Focus, partie non transcrite]

Philippine Dolbeau : Déjà fortement impliqués dans des actions locales, à l’image des académies régionales, les ministères proposent désormais tout un tas d’outils pour des données beaucoup plus intuitives, qui répondent aussi à différents enjeux de transparence pour les citoyens. À quels défis l’Éducation nationale fait-elle face en matière d’open data et puis, que veut dire open data ? On en parle avec notre invité dans la première partie du talk.

Le talk

Philippine Dolbeau : Aujourd’hui à nos côtés pour en parler, Philippe Ajuelos. Je rappelle votre titre, parce que, dans votre titre, il y a tout un tas de sujets dont on va parler aujourd’hui dans l’émission. Vous êtes administrateur ministériel des données, des algorithmes et des codes sources, au sein de la Direction du numérique pour l’éducation. Nous sommes ravis de vous avoir, Philippe. On a beaucoup de sujets à voir avec vous aujourd’hui. Peut-être une première question : on a commencé à parler, en introduction, de l’open data, un gros mot, mais vous allez peut-être le décrypter pour nous. Qu’est-ce que veut dire l’open data ?

Philippe Ajuelos : L’open data, c’est d’abord, pour toutes les administrations, les collectivités, les établissements publics, l’obligation de mettre à disposition toutes les informations qui ont été créées par des outils numériques à l’occasion d’un service public. C’est une obligation. Il y a évidemment des contraintes : ne pas dévoyer certaines règles concernant les données à caractère personnel, mais, à partir du moment où on n’est pas dans ce cadre-là, on doit mettre à disposition. C’est l’obligation pour tout le monde.
Le plus de l’éducation, c’est aussi un outil pédagogique pour la culture du numérique d’une façon générale, et de l’apprentissage des technologies, notamment le fait de maîtriser la donnée, l’information, et aussi essayer d’en faire quelque chose.

Philippine Dolbeau : Justement. En 2021, Philippe, votre ministère, celui de l’Éducation nationale, a mis en place une feuille de route [2] dans le cadre d’une politique qui se constitue comme une priorité stratégique pour l’État qui est celle des données. Pourquoi était-ce si important, pour le ministère, de mettre en place ce plan sur la politique des données ? Pourquoi est-ce essentiel aujourd’hui ?

Philippe Ajuelos : Peut-être rappeler, avant, que cette démarche n’est pas une démarche du ministère, c’est une démarche du Gouvernement qu’on applique au sein du ministère, qu’on adapte au sein du ministère. On a des AMDAC, des administrateurs ministériels des données, des algorithmes et des codes sources dans chaque ministère, un à l’Enseignement supérieur et la Recherche, à l’ Éducation nationale, au ministère des Finances. Et vous avez compris que selon nos obsessions et nos volontés on va axer sur un domaine plutôt qu’un autre.
On avait une masse d’informations, parfois on a l’impression que c’est de l’imaginaire qui est projeté quand on parle des mines d’or d’informations, ce sont beaucoup de choses qu’on doit exploiter, mais de systèmes d’information qui sont un peu vieillots, différents, disparates. On a des informations sur la façon dont ça se passe dans les établissements, dans nos services, l’idée c’est comment on peut faire, avec nos services en interne, des EdTech ou des labos de recherche, pour en faire quelque chose, avoir une information claire, en tout cas une information qui complète l’information qu’on peut avoir avec les outils classiques. On est dans des démarches de constats, mais aussi de prévisions, voire de prédictions. C’est l’objectif du ministère : trouver des moyens pour avoir une meilleure visibilité de ce qu’on fait, voire des réponses à ce qu’on veut faire.

Philippine Dolbeau : N’y a-t-il pas aussi, Philippe, un sujet de confiance avec lequel le ministère souhaite renouer : amplifier l’ouverture des données, oui, effectivement, des algorithmes et des codes sources, mais aussi plus de transparence de l’action publique ?

Philippe Ajuelos : C’est très important parce que, en réalité, dans cette démarche d’accompagnement des élèves, des professeurs, c’est aussi accompagner des générations à maîtriser des technologies, à ne pas en avoir peur, ne pas être naïves par rapport à ces technologies-là, notamment l’intelligence artificielle, donc expliquer comment ça fonctionne, comment un algorithme fonctionne. La meilleure façon de le faire c’est d’abord de publier l’algorithme, les éléments de l’algorithme, les codes sources, de publier les données qui sont issues de toutes ces informations qu’on récolte et puis d’expliquer. On explique et on donne aussi les moyens, à d’autres, d’expliquer ce qu’on met à disposition, en toute transparence.

Philippine Dolbeau : Comprendre la donnée brute, on l’a compris, n’est pas à la portée de tous, et c’est au cœur de vos actions, ça implique aussi et surtout de la formation, la formation des personnels à ces nouvelles technologies, à ces nouvelles pratiques aussi. C’est justement au cœur de votre métier, vous n’avez pas trop la pression non plus ?

Philippe Ajuelos : On a beaucoup de pression parce que le passage de l’échelle c’est un peu comme l’EdTech, les problématiques de numérique pédagogique, c’est accompagner 860 000 profs, pratiquement 13 millions d’élèves, donc c’est compliqué pour nous.

Philippine Dolbeau : Comment s’y prend-on ?

Philippe Ajuelos : Comment on s’y prend. Il faut avoir la pêche le matin, l’envie et se dire que peu importe la fatigue du soir, on va retourner le lendemain avec l’envie de faire bien et puis essayer de changer les choses concrètement, au quotidien, dans les établissements. On propose des formations, on accompagne sur le terrain et on démultiplie par capillarité. L’inconvénient c’est qu’on est partout, l’avantage c’est qu’on est partout aussi, on peut donc agir de façon dynamique par rapport à ça.

Philippine Dolbeau : Donc ça passe par de la formation. Vous vous rendez dans les établissements scolaires, auprès des enseignants, des élèves.

Philippe Ajuelos : On le fait sous différentes formes, on utilise du numérique, notamment des outils en ligne. On le fait aussi, parce que le numérique a besoin d’humain, par des rencontres avec les professeurs, avec les cadres du ministère, avec les associations aussi, les collectivités, tous nos partenaires, pour essayer de mobiliser l’ensemble des acteurs de l’éducation par rapport à cette problématique de la donnée.

Philippine Dolbeau : Philippe, au cœur de cette feuille de route du Gouvernement, il y a aussi, selon ce dernier, « d’améliorer l’efficacité de l’action publique grâce à la donnée », parce que jusqu’alors la donnée était très peu utilisée dans l’évaluation des politiques publiques en France ?

Philippe Ajuelos : En fait, beaucoup de choses avaient déjà été faites. La vraie question c’est de croiser nos informations, travailler aussi sur la qualité de la donnée. Quand la personne qui doit saisir ces données-là ne comprend pas à quoi ça sert, elle ne va pas forcément le faire avec l’idée de le faire bien, en tout cas c’est en plus de son quotidien, de son travail. Donc, on explique à quoi ça va servir et surtout, pour chaque donnée récoltée, on assure à la personne qui saisit qu’on va lui rendre l’information, qu’elle va pouvoir se comparer, qu’elle va aussi pouvoir diffuser et même créer des liens. C’est l’intérêt, pour nous, d’accompagner ce mouvement-là.
Il y a la formation, il y a l’amélioration des outils, il y a aussi la capacité, pour nous, de proposer des outils qui permettent de lire facilement la donnée. Personne n’est capable de lire un tableau. Donc, quand vous allez sur notre open data, pour certains jeux, vous cliquez sur un bouton et vous avez une cartographie qui s’affiche avec les informations sur l’établissement, sur ce qu’il propose en termes de langues, de spécialités. Pour certaines régions académiques, vous avez la possibilité de savoir quelles sont les activités sportives les plus proches de votre établissement ou de votre maison. Ce sont les informations qu’on donne.

Philippine Dolbeau : Plus de lisibilité. C’est aussi un moyen de développer l’esprit critique de la population vis-à-vis de certains préjugés qui sont portés envers l’Éducation nationale comme envers d’autres ministères d’ailleurs. L’accès à la donnée permet aussi de changer un peu les points de vue.

Philippe Ajuelos : Nous avons fait un travail sur nous. Nous avions été un peu contestés sur certains jeux de données, notamment la publication de l’indice de position sociale qui permet de savoir quelle est l’origine sociale des parents. C’était donc des jeux de données un peu sensibles. On a fait le pari de les publier et de répondre à des sollicitations de certaines associations qui voulaient avoir encore plus d’informations, non seulement avoir l’indice de position sociale sur l’année 2022, ce qu’on avait fait, mais sur les années antérieures et avoir ce qu’on appelle l’écart-type au sein l’établissement. C’est quoi l’écart-type ? C’est savoir si, au sein d’un établissement, il y a aussi de la mixité. On a dit « OK, on va tout publier » et on rend compte, en même temps, à ces associations, à ces professeurs, à ces élèves, de la réalité de l’état de ces établissements. Pour nous c’était important de commencer par là. La Direction de l’évaluation, de la prospective et de la performance, qui est notre service statistique, nous a aidé à faire ça, qui était, évidemment, responsable de ce jeu de données, qui a joué le jeu et est allé au-delà de ce que demandait la réglementation.
C’est important pour nous : aller au-delà de ce que demande la réglementation. La réglementation demandait uniquement la publication de ce jeu de données, nous sommes allés dans un niveau de granularité qui était beaucoup plus important, une étendue beaucoup plus importante, et puis la lisibilité qui était nécessaire pour comprendre comment lire ce jeu de données.
Après, des élèves se sont emparés de ça pour savoir comment améliorer la carte scolaire, donc discuter avec les collectivités et c’est aussi un élément de fierté.

Philippine Dolbeau : Parce qu’avoir des données c’est bien, mais savoir les lire c’est encore mieux, effectivement.
On va continuer à évoquer ces sujets ensemble, Philippe, si vous le voulez bien, on va d’abord faire un tour du côté de la planète tech.

[Le Zap – Partie non transcrite]

Le talk – deuxième partie

Philippine Dolbeau : En intégrant sur son site internet tout un tas de jeux de données, le ministère de l’Éducation veut donner aux enseignants, aux associations, aux collectivités locales et aux acteurs économiques aussi, des informations éclairantes pour leurs prises de décision. On continue d’en parler avec notre invité, Philippe Ajuelos. Vous êtes administrateur ministériel des données, des algorithmes et des codes sources, rien que ça, au sein de la Direction du numérique pour l’éducation.
Le ministère de l’Éducation nationale de la Jeunesse et des Sports a été, soyons très clairs, l’un des premiers à s’engager pleinement dans une démarche d’ouverture et de partage de la donnée. La plateforme data.education.gouv.fr [3] permet, par exemple, la consultation de jeux de données comme le calendrier scolaire, l’annuaire des établissements dont vous nous parliez juste avant la chronique de Dorith, les résultats d’examens, etc. C’est une base et c’est essentiel, c’est important.
J’imagine que les données sont nombreuses sur les élèves, sur les enseignants, sur le secteur. Dans quelques mois, quelques années, que va-t-on pouvoir trouver sur cette plateforme ?

Philippe Ajuelos : D’abord, nous ne sommes pas les premiers, mais on a coconstruit ce site avec les utilisateurs. On a ouvert un nouveau site l’année dernière, en janvier 2023, et, pendant trois mois, on a demandé à l’ensemble des utilisateurs ce qu’ils voulaient, comment ils voulaient que ce soit présenté, les services qu’ils voulaient avoir et puis les jeux de données. Nous avons été très étonnés parce que c’étaient des utilisateurs plutôt profs, étudiants, un peu de collectivités, tout profil. Donc, pendant trois mois, on a ouvert un guichet, en réalité, ce guichet est toujours ouvert. Tout utilisateur de ce site peut, via un lien, demander des jeux de données et, d’abord, on répond, c’est une première chose et, systématiquement, on essaye de mettre à disposition les jeux de données. En un an, on a augmenté de 30 % le nombre de jeux de données.
En parallèle, on a fait deux choses : on a mis à jour les anciens jeux de données parce que ce n’est pas tout de créer de nouveaux jeux de données, il faut les mettre à jour et puis on a travaillé sur leur lisibilité, c’est-à-dire pouvoir décrypter le jeu de données, ce qu’il veut dire, le comparer à d’autres jeux de données en France et à l’étranger. C’est donc vraiment expliquer comment est fabriquée la donnée, ce qu’on peut en faire, comment on peut l’interpréter. Quelque part, c’est de la pédagogie, c’est un des éléments de l’éducation aux médias et à l’information. Expliquer comment c’est créé, par qui, pourquoi, dans quelle intention, donc d’accompagner cette démarche-là.

Philippine Dolbeau : Le ministère encourage donc les établissements scolaires, vous l’avez dit, et les enseignants, à développer des projets autour de l’open data, la donnée ouverte. L’objectif, c’est évidemment d’en comprendre les enjeux grâce à des exercices autour de ces données ouvertes. Je crois que vous avez quelque chose à nous dire aujourd’hui.

Philippe Ajuelos : Des initiatives sont déjà réalisées par des associations d’ailleurs, par des établissements et aussi par des régions académiques, nos collègues, en académie, qu’on appelle les délégués académiques au numérique éducatif, les DANE [Délégation académique au numérique éducatif] et DRANE [Délégation régionale académique au numérique éducatif], que je salue, il y a pas mal d’initiatives.
Il y a aussi des outils comme CAPYTALE [4], je ne sais pas si vous le connaissez, développé par l’académie de Paris, mais qui est déployé au niveau national, qui permet aussi de jouer avec les statistiques, les jeux de données, de faire des croisements de données, c’est donc un outil qui n’est pas mal.
Avec d’autres partenaires, avec la partie Wikidata de Wikimédia et, potentiellement, Datactivist [5], j’espère que je n’écorche pas le nom, de créer – je dis Challenge, mais ça ne va pas s’appeler Challenge –, de donner envie à des équipes pédagogiques, à des élèves de lycée, d’utiliser l’ensemble des jeux de données du ministère, il faudra qu’il y ait quand même un jeu de données du ministère, pour nous motiver aussi, pour nous challenger, d’autres administrations, d’autres pays, pour avoir une visibilité sur une politique publique, pour créer des services. En fait, pour initier chez les filles et chez les garçons l’envie d’être le futur créateur de Citymapper ou de Wise, parce que c’est fait avec de l’open data, il faut le savoir.

Philippine Dolbeau : Vite Ma Dose aussi, par Guillaume Rozier [6] qui est Français.

Philippe Ajuelos : Que je salue.

Philippine Dolbeau : Votre objectif, c’est aussi de créer des vocations avec des entrepreneurs français qui, à terme, utilisent vos données, les données de l’action publique.

Philippe Ajuelos : Exactement, et qui nous motivent aussi à en faire plus, à proposer plus d’« explicabilité » et de transparence, c’est vraiment ce qu’on veut amener. On travaille sur le citoyen de demain, donc sa composante numérique, et c’est important, pour nous, d’avoir des élèves qui soient des citoyens éclairés, qui aient envie d’agir sur la société, de comprendre cette société et aussi de changer.

Philippine Dolbeau : C’est effectivement important. Vous le savez, des arguments subsistent néanmoins pour lutter contre l’exploitation en masse de ces informations scolaires. Notamment, au cœur de ces préoccupations, la protection des données des élèves et des élèves suivant des cours en ligne. Le site américain Politico expliquait par exemple en 2014, il y a dix ans, que seules 7 % des entreprises travaillant dans le domaine de l’éducation, avec les établissements scolaires, aux États-Unis, étaient légalement contraintes de maintenir la confidentialité de ces données. C’était aux États-Unis il y a dix ans. Des années plus tard, pas encore de chiffres très spécifiques en France, mais la question est la même : est-ce que vous comprenez les craintes des enseignants et, à la fois aussi, de ces entreprises du secteur de l’éducation qu’on reçoit tous les jours en plateau et qui utilisent ou génèrent ces données ?

Philippe Ajuelos : Je parlais initialement d’une approche des technologies qui ne soit pas naïve. Il faut aussi travailler sur les problématiques de sécurité.
Au ministère, on a développé toute une doctrine, le cadre de confiance du ministère, qui est non seulement le respect du RGPD [7], la réglementation sur la protection des données, mais aussi une démarche éthique. Dans cette démarche éthique, on va beaucoup plus loin que la protection des données, que la réglementation elle-même. C’est-à-dire qu’on s’interdit certains services, même si c’est admis par la réglementation,qui pourraient enfermer l’élève plutôt que le libérer. À force de personnaliser les parcours, à force de développer des algorithmes, le risque qu’on peut avoir, c’est d’enfermer dans ce qu’on imagine le mieux, parce que, évidemment, c’est ce qu’on imagine. Encore une fois, l’idée, c’est d’avoir un outil et pas une solution universelle.
Ce qui nous protège le plus, c’est que, de toute façon, ce sont des outils complémentaires à la pédagogie du professeur. Le seul qui soit capable de poser un diagnostic pédagogique, c’est le professeur. Il va utiliser un outil numérique, il va utiliser de l’IA comme un complément, comme un assistant, et pas du tout comme un élément fondamental de sa pédagogie. C’est important.

Philippine Dolbeau : Que vous aurez validé quand même un amont.

Philippe Ajuelos : Bien sûr, qu’on aura validé, qu’on va évaluer au fur et à mesure. Par exemple, une partie de ma fonction, c’est d’évaluer les outils qu’on met à disposition des professeurs et des élèves de telle façon à s’assurer que ça respecte bien, dans les faits, ce qu’on a demandé, et pas ce que ça peut faire.

Philippine Dolbeau : Merci beaucoup, Philippe. Sensibiliser, former et puis accompagner tous les acteurs de l’éducation sur ce chemin et sur l’ouverture de ces données.
Je rappelle que vous êtes administrateur ministériel des données des algorithmes et des codes sources au sein de la Direction du numérique pour l’éducation.
Merci d’avoir été avec nous. Nous avons été ravis de vous recevoir. Merci aussi à vous, Dorith, pour cette chronique. Merci à vous de nous avoir suivis et on se retrouve dès demain dans L’École du futur. Bonne journée.