Présentatrice : Salut et bienvenue sur Plein la vue, le podcast qui parle de l’omniprésence de la publicité et du marketing dans notre quotidien. Ce podcast est produit bénévolement. Si vous souhaitez le soutenir, abonnez-vous et parlez-en autour de vous.
Dans ce nouvel épisode, il sera question de fenêtres pop-up, de bannières publicitaires et des fameux cookies, du fonctionnement des réseaux sociaux et de bloqueurs de pub. Bon épisode.
Diverses voix off : En ce moment, il y en a vraiment beaucoup, je trouve.
Oui, un petit peu trop, parce que, par exemple, si on veut aller sur Internet, il y a toujours une publicité au début ou à la fin. Du coup, c’est un peu énervant.
En vrai, ça dépend sur quel sujet ça porte, mais il y en a énormément sur toutes les plateformes. Des fois, c’est quand même un peu saoulant. Après, sur TikTok, on n’est pas obligé de la regarder en entier, ça ne dérange pas trop, alors que vraiment, sur YouTube, on doit regarder tout entier pour pouvoir passer à la suite, donc, ça c’est chiant.
Ce que je trouve terrible sur Internet, c’est ce que les gens disent que les utilisateurs d’une certaine plateforme quand leurs pubs sont interrompues par une coupure vidéo, parce qu’il y a énormément de pub.
C’est comme si c’était inversé.
Voilà, exactement. Après, je comprends aussi que ce soit un moyen de rémunérer, en fait, qu’on ne puisse pas faire sans pub non plus, mais, je me dis que certaines personnes abusent quand même du truc.
Par exemple, toute la journée je sors, je parle d’un sujet et quand je rentre chez moi, je vais aller sur mes réseaux sociaux, je retrouve ce sujet. Même si je fais une recherche Google, que je cherche, par exemple, « vélo », quand je vais aller sur Insta, je ne trouve que des vélos. Je ne trouve que ça, alors que j’aimerais avoir plus de choses.
À chaque fois de voir et de revoir des pubs, ça me frustre et, du coup, ça m’énerve parce que ce sont toujours des grandes entreprises qui s’enrichissent et qui s’enrichissent !
Diverses voix off : Épisode 10 : Publicité sur Internet. Pourquoi et comment la bloquer ?
Marne : Bonjour. Je m’appelle Marne. Je suis militante et salariée à La Quadrature du Net [1] depuis 2017. Mon travail, c’est tout ce qui touche à la communication. En gros, j’organise les campagnes de sensibilisation, je réfléchis aux messages qu’on a envie de véhiculer et après, je réalise les supports de communication.
Nado : Bonjour. Je suis Nado, militant et bénévole à La Quadrature du Net depuis longtemps. J’ai pas mal travaillé sur les questions de publicité numérique dans ce cadre et à côté aussi, je suis aussi membre de Résistance à l’Agression Publicitaire [2].
Marne : La Quadrature du Net est une association à but non lucratif, constituée de militants, qui existe depuis 2008, qui a pour but de lutter contre la surveillance et la censure qui viennent des États et des entreprises. Pour ce faire, elle investit notamment beaucoup les moyens juridiques. Les textes de loi qui vont intéresser La Quadrature sont tous ceux qui mettent en jeu la volonté d’encadrer une technologie émergente. Les questions qui vont intéresser La Quadrature sont toutes celles qui sont reliées aux libertés, principalement des questions de surveillance et de censure.
Dans ce cadre-là, on analyse les textes, déjà pour porter à la connaissance du public, des gens qui sont concernés par ces textes de loi, quels enjeux il va y avoir sur leur vie, sur leur quotidien, on produit des analyses juridiques. On peut aussi, parfois, arriver à des logiques de contentieux, c’est-à-dire attaquer des décrets ou des textes. On va devant le Conseil d’État, devant le Conseil constitutionnel ou devant la Cour de justice de l’Union européenne pour mettre en évidence le fait que certaines dispositions seraient contraires aux libertés.
Présentatrice : La Quadrature du Net est une association très importante en France dans la défense des libertés et droits fondamentaux numériques. Ses premiers combats portaient sur la défense du libre partage de la connaissance et de la culture sur Internet, puis, progressivement, les sujets se sont élargis au fur et à mesure que le numérique a pris de plus en plus de place dans la société. C’est ainsi que vers 2015, La Quadrature s’est intéressée de plus en plus aux lois qui, sous des prétextes souvent antiterroristes, visaient à renforcer la surveillance et la censure sur Internet. Ou encore, plus récemment, elle a réalisé un gros travail sur les dispositifs de surveillance dans les villes qui utilisent de l’intelligence artificielle, comme certaines caméras de surveillance qui ont été déployées à l’occasion des Jeux olympiques à Paris. Avant cela, et c’est le sujet qui va nous intéresser dans cet épisode, La Quadrature a travaillé sur la question des données personnelles, qui sont devenues un grand enjeu, notamment dû au développement de l’industrie de la publicité en ligne.
Bref, pour résumer la diversité des sujets qui sont dans le champ de cette association, on peut dire qu’elle s’intéresse, de manière générale, au développement des techniques numériques et de leur encadrement par les lois, afin de lutter contre la censure et la surveillance, que celles-ci viennent des États ou des entreprises privées. Je vous renvoie à leur site, laquadrature.net, qui est rempli d’articles hyper-intéressants sur tout ça.
Venons-en maintenant au sujet de la publicité sur Internet, avec quelques éléments historiques pour comprendre son développement.
Marne : Dans un premier temps, Internet était vraiment perçu par les gens qui l’ont investi en premier lieu comme un espace de liberté, un endroit où n’importe qui pouvait s’exprimer sans avoir besoin d’affirmer une quelconque légitimité, où il y avait vraiment cette idée d’expression à pied égal. Avec l’arrivée de la sphère économique et d’une marchandisation d’Internet, progressivement, ces espaces se sont réorganisés autour de logiques plus hiérarchiques. On peut aborder la question des réseaux sociaux qui, dans un premier temps, étaient le moyen de créer des liens, qui ont été le moyen, pour des gens particulièrement isolés, de se rattacher au reste du monde et qui, progressivement, ont pris une forme donnée visant à servir des objectifs commerciaux. Du coup, on va pouvoir aborder la question de la publicité, du fait, qu’au début, elle était très peu présente sur Internet, que, dans un premier temps, elle a pris une forme assez sociale, dans le sens de s’échanger des bannières publicitaires, et, progressivement, elle s’est industrialisée jusqu’à devenir la giga-machine qu’on a aujourd’hui de collecte d’informations et d’adressage publicitaire ciblé.
Nado : Au début, Internet a été pensé par des militaires et des chercheurs qui n’avaient pas du tout d’intérêts économiques, et, malgré tout, ça s’est imposé parce que la technique était robuste et permettait d’échanger facilement de l’information. Les réseaux se sont connectés pour former l’Internet et ça s’est imposé au monde, sans qu’il y ait la possibilité de monétiser facilement des comportements, des actions, des articles, parce que des problèmes de sécurité sur les échanges bancaires, pas de facilités d’amener de l’argent. Effectivement, quand les entreprises ont dit « on n’a plus le choix d’être ou pas sur Internet », la seule chose qui s’est imposée, c’est le modèle du paiement différé, où les personnes ne vont pas payer directement les services ou les articles qu’elles vont consulter en ligne, mais elles vont les payer quand elles vont aller en magasin à travers la publicité, donc le modèle qui était déjà utilisé autour de la télévision.
Marne : C’est vrai que le modèle économique basé autour de la publicité, au final, il est quand même pas mal hérité du fait qu’Internet s’est présenté en premier lieu comme étant un espace d’accès à l’information gratuit et cette logique de gratuité était très importante. On la trouve toujours, par exemple sur Wikipédia, où il n’y a pas de modèle économique basé sur la publicité et il n’y a pas non plus de paiement. Le fait que, dans un premier temps, tout le monde ait pu accéder à de l’information de manière gratuite a fait que, plutôt que de mettre en place des modèles payants, les acteurs qui ont cherché à devenir rentables sur Internet se sont automatiquement tournés vers la publicité, puisque les utilisateurs d’Internet ne renonceraient pas aussi facilement au fait que l’idée de l’accès à ces espaces se faisait sans payer.
Présentatrice : Internet n’a donc pas été, à la base, pensé et conçu pour des pratiques économiques. Mais les entreprises ont saisi l’importance de ce nouveau média et ont commencé à l’investir. Celles-ci se sont alors confrontées à un problème : le rejet des utilisateurs du paiement en ligne, ceci dû à des craintes, plutôt justifiées, liées à la sécurité des données bancaires, mais surtout à des pratiques déjà ancrées d’accès gratuit. Pourquoi payer pour une information alors qu’elle est déjà présente, en accès libre, sur un autre site ? En réponse à cela, la publicité s’est développée en se présentant comme un moyen de financer des services en ligne en apparence gratuits pour les utilisateurs. C’est ainsi qu’elle s’est imposée comme modèle économique dominant sur Internet et qu’elle s’est intégrée progressivement dans le quotidien des utilisateurs.
Marne : Il y a deux leviers qui sont principalement investis par ces acteurs.
C’est d’abord celui qui est très propre au réseau social, qu’on va retrouver sur Facebook, qui est la question du réseau, donc le fait que, dans un premier temps, Facebook n’était pas du tout aussi nul que maintenant. C’était un service plutôt sympathique et attrayant, ce qui fait que plein de gens se sont mis à y aller. C’est une fois que les gens y sont, que tous leurs amis y sont, que les gens se sont mis à utiliser Messenger et, en fait, à se servir de Facebook pour maintenir leurs liens avec des gens, qu’ils ont été enfermés. Ils ont beau subir les désagréments de la publicité et la détester, ils vont quand même choisir d’y rester parce qu’ils ont leurs liens sur ce réseau-là.
Le deuxième levier, c’est le levier des contenus. Par exemple, pourquoi s’intéresser plus à YouTube et au fait que si les gens vont sur YouTube, c’est parce qu’ils y trouvent des choses intéressantes. Là, on a eu aussi tout un mécanisme de redistribution – je ne sais pas comment on pourrait le nommer –, de faire partager le trésor publicitaire, dans une moindre mesure, à certains créateurs de contenu qui accepteraient d’afficher de la publicité pour, à leur tour, les rendre dépendants de la logique publicitaire, puisque la création de contenu se retrouve conditionnée à la publicité, avec pour effet aussi, un effet courant de la publicité, qui n’est pas spécifique au monde du numérique, qui est la censure potentielle des annonceurs. Certains contenus, qui abordent certains sujets, seront plus propices à être censurés, c’est-à-dire que les annonceurs ne voudront pas voir leur nom à côté de quelque chose de trop politique, par exemple, du coup, ça va mettre en avant et valoriser un certain type de contenu. Donc, là aussi, ça va donner une forme particulière au réseau social, par exemple à la manière de partager les vidéos, en orientant même le fond des sujets pour esquiver tous ceux qui ne seraient pas acceptés par les annonceurs. YouTube va même intégrer, dans ses logiques, des mécanismes de censure pour prévoir la réaction de l’annonceur et que, en premier lieu, ce type de contenu soit moins fréquent, en tout cas, ne soit pas financé par la publicité.
Nado : Il y a effectivement plein d’exemples systématiques. Pour prendre une vision d’ensemble, les clients de YouTube sont les gens qui payent pour que la publicité s’affiche. Si énormément de tes clients sont des entreprises étasuniennes puritaines, pour toutes les questions qui vont toucher autour de la représentation des corps – on pourrait prendre par exemple Twitch et Amazon, une grosse entreprise publicitaire au travers de Twitch –, il y aura des règles assez claires pour les contenus qui seront associés à la publicité : pas de nudité, on peut faire pas mal de trucs, mais il faut rester dans le puritanisme étasunien. C’est l’idéologie étasunienne qui est reproduite au travers aussi du mécanisme des équilibres publicitaires. Pour les questions de conflit, vu que les personnes peuvent ne pas vouloir voir des réalités qui sont vraiment dures, soit on va mettre les vidéos de côté, on ne va pas les mettre en valeur, soit on va dire à la personne « tu as enfreint les règles de service, cela ne convient pas à nos clients que sont les publicitaires, on va juste te retirer de la plateforme parce que tu vas nous faire perdre des revenus. » En fait, c’est juste cette logique : les gens qui apportent l’argent, les entreprises capitalistes qui payent la publicité, dictent les règles du jeu.
Quand les entreprises ont commencé à vouloir faire des revenus publicitaires en ligne, la façon simple c’était d’avoir un bout d’une page web où va s’afficher un message publicitaire qui va être vu par les personnes qui vont aller sur cette page, qui peuvent être intéressées par ce qu’il y a à côté, avec l’avantage du numérique – même s’il y avait des limites à l’époque : on peut regarder combien de personnes ont ouvert cette page. Le serveur peut dire « il y a eu une connexion », donc on peut voir les gens qui auraient vu la page et vu la publicité s’afficher. À la base, c’est juste ça, on met des images publicitaires ou des textes publicitaires sur des pages qui sont consultées.
Au début d’Internet, les usages n’étaient pas du tout établis et les revenus publicitaires n’étaient pas forcément très conséquents, parce que les annonceurs n’avaient pas forcément de certitudes sur qui utilise Internet, c’était un peu le vieux monde pré-Internet qui découvrait aussi en se demandant « est-ce que c’est pertinent d’investir là-dedans ? » Pour avoir des revenus supérieurs, peut-être nécessaires à ces personnes pour leur activité économique, il y a eu une multiplication très forte des bannières publicitaires et aussi un début de créativité un peu mal placé sur la façon dont on utilise cet outil pour maximiser le fait que les gens voient la publicité.
Par exemple, une personne qui s’appelle Ethan Zuckerman [3], un activiste qui a aussi défendu les libertés fondamentales par la suite, était à un moment dans une boîte où ils ont participé à développer ce qu’on appelle le pop-up publicitaire. En gros, on va sur une page et un mécanisme technique fait qu’automatiquement une autre page s’ouvre, où il y a une publicité séparée, voire, quand on la ferme, il y a encore un autre pop-up qui s’ouvre. Comme ça, il y a eu un peu une créativité ingénieuriale, vraiment pas terrible, qui s’est mise à créer plein de méthodes pour que l’on soit bien sûr que les gens aient bien vu la publicité et aussi en mettre le plus possible, parce que, comme ça, on gagnait plus d’argent. On a donc commencé à avoir une espèce de fuite en avant du nombre de publicités, de leur intrusivité, de leur agressivité, pour dégager des revenus.
Les premières publicités en ligne c’est entre 90 et 95 et, jusqu’en 2005, un peu cette espèce d’augmentation fonctionnelle du nombre de publicités avec, après, le début de la guerre avec les bloqueurs de publicités qui a commencé à ce moment-là.
Il y a donc un début d’organisation avec des structures qui viennent prendre des rôles. Au début, on veut afficher une publicité, c’est une négociation : le site Internet dit « je suis d’accord pour mettre votre message, tant de visites sur ma page, ça va être telle somme ». Au début, on a, comme cela, des échanges qui sont très limités, et, après, des plus grosses structures vont se mettre autour, donc des régies publicitaires qui se mettent à avoir des clients qui les payent et elles vont les dispatcher sur différentes pages en promettant un certain nombre de vues à différents endroits. On commence déjà à avoir un système intégratif avec quelques gros acteurs et, après, on commence à avoir des acteurs numériques qui se développent autour de services complètement gratuits et complètement à fonds perdus, vraiment des services qui, à la base, sont montés avec du capital investissement qui fait qu’ils avaient les poches pleines et qu’ils n’avaient pas besoin de gagner de l’argent. À un moment, après avoir converti des millions de personnes à leurs utilisations, ils se sont demandés comment monnayer ça, puisque les entreprises capitalistes ont cette obligation-là. Et effectivement, beaucoup d’entre elles se sont tournées exclusivement sur le modèle publicitaire, mais avec cette limite qu’afficher plein de publicités, ça ne marchait pas trop parce que des gens avaient des bloqueurs de pubs, voire il commençait à y avoir des mécanismes inverses, c’est-à-dire que quand on voyait trop de pubs on associait une image négative aux publicités qu’on voyait.
Des acteurs particuliers, donc Facebook et Google, avaient un placement particulier sur les pratiques numériques. Google, en premier, qui s’est imposé comme le moteur de recherche quasiment unique – c’était le point de passage exclusif, encore à l’heure actuelle, de 90 % des personnes européennes pour aller chercher des informations sur Internet –, avait donc accès au premier rapport qu’avaient les personnes avec le Web. Facebook, qui a supplanté d’autres réseaux sociaux qui préexistaient, mais qui ont moins fonctionné, à un moment avait, en fait, la quasi-totalité des goûts des personnes, de tous leurs échanges sociaux. Il s’est imposé structurellement, à un moment, comme étant un nœud central de la vie numérique et sociale des personnes ; il avait peut-être moins d’accès direct mais il avait des informations vraiment beaucoup plus larges.
Ils se sont demandé comment utiliser les informations qu’on a pour faire des publicités plus efficaces.
Présentatrice : Il faut savoir que même si de nombreuses personnes et entreprises se sont tournées assez naturellement vers la publicité pour obtenir des revenus en ligne et que ce modèle paraît très difficile à remettre en question aujourd’hui, il y a eu des réticences, des questionnements éthiques dès le début, et ce, même au sein de Google, car des personnes ont bien senti que ça n’allait pas dans le sens de l’intérêt général, ou encore dans le sens de valoriser, de diffuser les contenus les plus intéressants. Mais les audiences étaient en pleine croissance et ce nouveau marché de la publicité en ligne a trouvé les arguments pour convaincre.
Nado : Au début, les gens de Google sont plutôt hostiles à la publicité. On a même des déclarations qui disent, en gros « s’il y a de la publicité sur un moteur de recherche, il va forcément être biaisé en faveur des annonceurs, donc plus du tout être dans l’intérêt du public, il ne faut donc pas laisser faire ça. » Mais, à un moment, ils se sont laissés convaincre, ils ont donc commencé à développer ce qu’on appelle la publicité contextuelle. Au lieu de juste faire des publicités qui vont être vues par le maximum de personnes, un peu comme la publicité de rue, ils vont essayer de la mettre aux endroits où elle sera plus vue. Ils vont essayer, quand c’est une page qui parle de jeux vidéo, de négocier plutôt des publicités pour des jeux vidéo. Google faisait cela très bien : on venait chercher des choses sur les voitures, il pouvait mettre des publicités pour des voitures. Facebook pouvait faire encore mieux parce que, lui, savait, il avait plein de caractéristiques des gens qui avaient dit « j’aime ci, j’aime ça », donc il pouvait juste dire « si les gens aiment bien ça, peut-être qu’ils vont aussi aimer cette même catégorie de choses ; ils ont dit qu’ils aimaient bien les voitures, eh bien on va leur mettre des publicités pour des voitures puisqu’ils aiment bien ça !, ça voudra dire que la publicité sera la plus efficace. » Ils ont commencé à créer les premières bases du ciblage publicitaire.
Marne : Je pense que le ciblage publicitaire n’a pas attendu Internet pour exister. C’est-à-dire que l’exemple que donnait Nado, se dire qu’on va afficher une publicité pour des jeux vidéo à côté de sujets qui parlent de jeux vidéo, ce sont des choses auxquelles les gens qui font de la publicité pensent depuis longtemps, ne serait-ce que pour choisir telle ou telle publicité qu’on va mettre dans tel un magazine féminin. Dans la manière dont sont fabriquées les publicités, les gens qui y réfléchissent pensent à qui ils vont s’adresser, ont donc tout un panel de cibles qui sont dessinées, parmi lesquelles il y a la ménagère de moins de 50 ans, je crois qu’on dit maintenant la femme responsable des achats, qui sont un peu, comme ça, des personnages inventés par les publicitaires pour trouver la façon de s’adresser aux gens. En fait, ce qu’on voit à travers l’affinage du ciblage publicitaire sur Internet, c’est un peu la suite logique de cela, c’est-à-dire que tout un tas d’informations sont récupérables sur les personnes, dans leur navigation : quand on se promène sur Facebook, qu’on va cliquer sur des liens, qu’on se connecte à une certaine heure, qu’on a renseigné son nom, son âge, son genre, qu’on a fourni des photos, qu’on échange avec telle ou telle autre personne, tout cela, ce sont des informations qui sont entre les mains de Facebook et qui lui permettent de faire des recoupements et de savoir que telle et telle autre personne ont des activités similaires, que ça peut donc être intéressant de rapprocher leurs logiques d’usage pour faire des recoupements et, en gros, faire ce même travail que celui que faisaient déjà les publicitaires, mais en imaginant quelles sont les pratiques des gens et pourquoi ils achètent. Là, on va se retrouver à connaître quelles sont les pratiques réelles des gens, donc à redessiner ces différentes cibles, mais sur une base concrète de leurs activités en ligne.
Le ciblage publicitaire est donc progressivement de plus en plus fin. Par exemple, je pense que c’est encore le cas aujourd’hui, ça fait longtemps que je n’ai pas regardé, si vous demandez à Facebook de pouvoir afficher une publicité, vous aurez le moyen de spécifier à quel type de personne vous voulez vous adresser, ce sont ces profils qui sont constitués par Facebook pour adresser la publicité. Progressivement, avec toutes ces informations, il va vers une logique qui est de plus en plus fine, allant jusqu’à l’individu. Là on parle de Facebook, c’est donc logique que Facebook ait les informations relatives à ses utilisateurs, mais en fait, Facebook a des informations bien au-delà de son propre réseau, notamment, par exemple, par l’intermédiaire de trackers, qui sont les pages tierces sur lesquelles il va y avoir des boutons like. Tout un tas, comme ça, de sites web vont lui permettre, au moins techniquement, d’avoir un accès à la navigation de différents acteurs et de pouvoir retracer tout ce schéma-là dans le but de conforter ses logiques de cible et d’adresser spécifiquement à un utilisateur une publicité.
Présentatrice : Cette question des données personnelles est vraiment centrale. C’est pourquoi je prends le temps de résumer et compléter ce qui vient d’être dit.
Ces données, ce sont toutes les informations qui sont personnelles, qui nous concernent, nous, parce que nous les avons émises ou reçues. Ça peut aller de la couleur de nos yeux, notre âge, notre métier, mais c’est aussi l’heure à laquelle on a visité un site internet, combien de pages différentes on a regardé sur ce même site et sur quel autre site on est allé après. Ces données sont quelque chose d’extrêmement collectif, parce qu’elles racontent qui nous sommes, où nous habitons, ce que nous faisons, mais aussi qui nous fréquentons et ce que nous partageons avec les autres.
On ne se rend pas du tout compte de toutes les informations qu’on laisse en ligne, de qui va les récupérer, qui va les acheter derrière et à quoi elles vont servir.
Ces données personnelles sont aujourd’hui au centre d’un marché mondial dont les principaux acteurs, les grandes entreprises du numérique, se sont accaparées pour en tirer de grands profits. Et là, on pense tout de suite à Google, Facebook, mais ce sont aussi d’autres entreprises, dont on connaît moins l’activité, comme celles qu’on appelle les courtiers en données. Nado en parlera un peu plus tard. Ce sont des intermédiaires qui collectent des informations à partir de ce que nous faisons sur Internet ou via les administrations publiques ou encore via les commerces, par exemple avec les informations qui sont liées aux cartes de fidélité. Et de tout cela on fait commerce aujourd’hui, largement au service de l’industrie publicitaire.
Nado : Pour continuer de creuser sur ça, à partir de ces deux acteurs, Google et Facebook qui avaient déjà des bases de données très fortes, il y a eu un ensemble de méthodes pour se dire : OK, on voit ce qu’ils font, en première étape sur Google, Gmail aussi potentiellement, et après, avec les outils, on peut avoir accès à leurs mails, même si c’est plus ou moins illégal ; on sait vraiment beaucoup de choses qu’ils font sur Facebook, mais Facebook n’est peut-être pas immortel, on va donc aussi acheter les concurrents qui font ça et, comme cela, on verra aussi ce qu’ils font sur les concurrents et on va essayer de continuer à suivre les personnes au travers de toute leur navigation. On monitore finement vraiment tout ce que font les personnes en ligne. On parlait des ingénieurs qui ont, au début, créé des méthodes pour forcer à voir la pub, eh bien ils ont continué à créer des méthodes pour ne jamais perdre la trace des individus dans leur navigation en ligne et ils ont créé des outils vraiment terrifiants en termes de logique de surveillance pour vraiment suivre les individus à la trace.
Marne parlait de ce que fait Facebook : on a ce qu’on appelle des cookies tiers. En gros, quand Facebook apparaît sur une autre page, l’autre page va pouvoir dire « tu étais déjà connecté sur Facebook sous ce nom-là », vu qu’il y avait un petit bouton like sur la page, Facebook récupère l’information que c’est la même personne qui était sur Facebook à un moment et qui est allée visiter cette page-là.
Il y a plein d’autres pratiques très sales.
Des liens vont être développés, on va mettre des outils dedans, on va savoir d’où vient la personne qui a cliqué sur ce lien, ce qu’on peut aussi utiliser dans les lettres d’information : chaque personne qui va recevoir le mail ne va pas avoir le même lien, donc on va monitorer, on va savoir que c’est cette personne à qui on a envoyé le mail et qu’on va suivre.
Il y a ce qu’on appelle des pixels invisibles, c’est la même logique. Ce sont des petites images que la personne ne va pas voir, mais, en fait, ça interroge une ressource qui est ailleurs, donc ce serveur-là va savoir que c’est cette personne et, pareil, va pouvoir suivre la personne à travers cela.
C’est vraiment un ensemble d’outils de surveillance très développés. Une chercheuse, qui s’appelle Zeynep Tüfekçi [4], détaille un peu ces outils de surveillance. Elle dit qu’on a vraiment créé une dystopie de surveillance complète, dont, je le rajoute, la Stasi aurait largement rêvé, juste pour que les gens, à la fin, cliquent sur la pub. On va essayer de les mettre dans la plus petite boîte catégorielle possible pour vendre aux annonceurs : si vous voulez toucher les personnes de plus de 50 ans, avec plus de 50 000 euros par an, qui viennent de divorcer et qui aiment les voitures rouges, eh bien Porche peut vendre la publicité pour ces personnes-là au bon endroit, au bon moment, pour qu’elles achètent une Porsche.
Marne : Avec, en plus, le fait qu’il est très difficile d’avoir conscience de à quel point on est surveillé. Par exemple, cette idée que parce qu’il y a un bouton Facebook sur une page, ça va nous rattacher au fait qu’on est connecté à notre compte, pourrait nous faire penser que si on n’a pas de compte sur Facebook, du coup on ne risque pas cette surveillance. En fait, on a découvert par la suite que si on n’a pas de compte Facebook, qu’on est pas connecté, ça n’empêche pas du tout Facebook de nous faire ce qui a été appelé à des shadow profiles. Ce sont, en fait, des espèces de profils fictifs attribués aux gens qui n’ont pas de compte sur Facebook pour, quand même, retracer leur navigation et quand même pouvoir les cibler et aussi utiliser leurs données pour nourrir l’entraînement de ciblage.
Après, il y a aussi tout un tas de services tiers. Le fait de surveiller la navigation, donc savoir combien de personnes sont exposées à un contenu n’intéresse pas que les publicitaires. Par exemple, un des pieds d’entrée dans la surveillance de Google c’est son outil Google Analytics, qui est installé par énormément de sites qui, en fait, ont juste envie d’avoir une meilleure vision sur qui a visité leur site et qui se retrouvent être tout un tas de données qui sont entre les mains de Google, qui viennent aussi servir ces logiques-là.
Présentatrice : Vous vous demandez peut-être comment ça se passe concrètement pour qu’une pub qui vous est destinée se retrouve affichée sur la page que vous consultez ou sur le fil de votre réseau social.
Comme expliqué juste avant, le ciblage publicitaire se base sur la collecte et l’analyse d’un très grand nombre de données personnelles, ce qui permet de vous dresser un profil. Quand vous ouvrez une page ou une application qui contient un espace publicitaire, une requête est envoyée à un serveur de publicité. Votre profil est mis aux enchères et la publicité du plus offrant vous est affichée. C’est ce qu’on appelle la technologie real-time bidding ou enchère en temps réel.
Nado : Les mécanismes d’affichage publicitaire sont vraiment complexes vu que plein d’acteurs sont dans la boucle, quasi systématiquement Google et Facebook, mais pas que. Il y a un système : quand un site internet a négocié avec un annonceur le fait que là il peut y avoir des publicités, quand une nouvelle personne va venir sur ce site Internet, ça va interroger des bases de données. On va se demander « est-ce qu’on connaît cette personne, est-ce qu’on ne la connaît pas ? Quelles sont ses caractéristiques ? », du coup, il va y avoir une négociation qui est automatique où des acteurs vont dire « si des personnes ont ces caractéristiques et que le prix de la publicité est à ce niveau-là, on est d’accord pour payer jusqu’à ça pour que cette publicité s’affiche à cette personne. » On a un mécanisme qu’on appelle enchère en temps réel, real-time bidding en anglais, un mécanisme complexe qui se fait avec plein de serveurs, à plein d’endroits – c’est quasi instantané, c’est en millièmes de seconde –, qui va négocier avec plein d’acteurs dans la boucle pour dire « là on a une personne qui a ces caractéristiques-là », donc tous les annonceurs qui sont sur les marchés publicitaires, là vraiment Google où on peut s’inscrire, on peut dire « je veux mettre des publicités à des gens qui ont ce profil, Google va dire « j’ai des acheteurs de cet espace publicitaire sur ce type de profil-là à tel moment-là ». C’est donc cela qui se nourrit de l’ensemble du champ de données préalables.
Marne : Si on veut s’intéresser à la raison pour laquelle le modèle publicitaire a autant d’impact et d’influence sur la forme qu’ont les réseaux sociaux aujourd’hui, il faut remonter à l’origine : comment, architecturalement, fonctionne le Web, c’est-à-dire qu’on est sur une logique avec des serveurs et des clients. Le site web est hébergé à un endroit où il y a un logiciel qui tourne, auquel on se connecte via un client. En fait, le fait que ça fonctionne de cette manière centralisée autour de ce serveur qui appartient à quelqu’un, ça concentre les pouvoirs.
C’est comme cela qu’on en arrive à, par exemple, Facebook où, en fait, on a une entreprise Meta qui, à la fois, héberge les données, choisit comment fonctionne l’affichage et comment sont organisés les contenus qui sont dessus et choisit aussi, du coup, quelle publicité est affichée et c’est quelque chose qui n’est pas du tout intuitif. Les choses pourraient être faites très différemment. On pourrait imaginer un réseau complètement pair-à-pair ou alors, on pourrait imaginer une organisation où ce n’est pas le même acteur qui héberge les données que l’acteur qui développe le logiciel, que l’acteur qui développe la partie client, c’est-à-dire comment c’est affiché pour l’utilisateur. Là, on a vraiment tous ces éléments qui sont dans les mêmes mains, c’est-à-dire que c’est la même personne qui peut récupérer les informations, faire la collecte des données et qui s’occupe de l’affichage de la publicité et cela influence la forme même du réseau social.
Si on prend les tout débuts de Facebook, les contenus étaient affichés de manière linéaire, donc, sur votre timeline, vous aviez la dernière chose postée. Progressivement, par l’influence publicitaire, les réseaux sociaux se sont mis à changer de forme, déjà dans l’objectif de faire en sorte que les gens restent plus longtemps sur la plateforme pour être plus longtemps exposés aux contenus publicitaires, il y a toute une logique sur la façon d’accrocher l’utilisateur en mettant en avant certains contenus qui sont ceux qui vont être le plus engageants émotionnellement, qui vont susciter un effet chez l’utilisateur. Il y a différentes stratégies qui, d’ailleurs, ne sont pas forcément les mêmes en fonction des réseaux sociaux, mais qui sont toujours orientées autour de cette logique qu’on appelle souvent l’économie de l’attention, qui est comment faire rester le plus longtemps possible la personne sur la plateforme pour qu’elle soit exposée à la publicité. Ensuite, il y a toute cette logique de ciblage dont on a parlé avant. En effet, on n’a pas de chiffres ou d’études qui nous permettent de savoir si ça fonctionne vraiment, en tout cas, c’est comme cela qu’ils vont le vendre aux annonceurs qui est de dire : on va mettre votre publicité à l’endroit où elle fonctionnera le mieux, au milieu des contenus qui vont permettre aux gens d’y être le plus réceptifs.
Les réseaux sociaux n’ont aucun intérêt à dévoiler la recette de la façon dont ils font ça. Si jamais il la révélait, ça ne serait pas forcément aussi intéressant pour les utilisateurs, par contre, pour eux, c’est très important que ça reste opaque, pour que les annonceurs ne sachent pas comment ils font ça et qu’ils puissent aussi développer tout leur discours promotionnel d’une technologie qui serait très fine et très efficace. Ils ont donc besoin de conserver une opacité sur ces questions-là.
Nado : Effectivement, la logique des algorithmes des réseaux sociaux, à priori, en tout cas de ce qu’on peut en comprendre, c’est qu’ils sont optimisés pour leur intérêt économique et leur intérêt économique, comme l’a dit Marne, c’est que les gens soient dans les meilleures dispositions et restent le plus longtemps sur la plateforme. Un truc qui est structurellement lié à un système de surveillance, un système qui utilise de la publicité en ligne, c’est qu’il faut capter le maximum d’attention des personnes. La petite phrase de Patrick Le Lay pour TF1 c’est que ce que fait TF1 c’est vendre de cerveau disponible à Coca-Cola, eh bien ce que fait Google, ce que fait Facebook, ce que fait YouTube, c’est de vendre du temps de cerveau disponible à des centaines de milliers d’entreprises. On a aussi un petit adage, ça vaut le coup de le rappeler même s’il a ses limites : « Si un service commercial est gratuit, c’est que les personnes qui l’utilisent sont le produit. » On a un paiement différé : en fait, on paye bien la publicité, mais on la paye quand on achète effectivement les services, en tout cas même quand on achète des services dont on n’aurait pas vu la publicité, vu qu’ils ont un coût de marketing, on la paye à ce moment-là. Ce sont bien toujours les individus qui payent la publicité, juste pas au même moment.
Cela a fait que dans l’organisation publicitaire des usages du Web tout est orienté vers la maximisation de la captation du temps de cerveau disponible, donc des algorithmes : pour que les personnes restent le plus longtemps sur YouTube, que les personnes restent le plus longtemps sur Facebook, on essaye de les enfermer selon ce qu’on pense qu’il va mieux marcher dans un truc type « quand on y va, ça nous rend heureux, ça nous rend joyeux, donc on a envie de revenir. » Pour cela, on utilise des recherches qui sont faites en neurosciences sur les réseaux de récompense, des trucs qui peuvent être de la manipulation vraiment très poussée. C’est la même logique que dans les casinos, des trucs qui vont créer des formes de proto-addiction ou d’addiction à des comportements, ce qu’on peut voir un peu avec les outils type TikTok, etc., des trucs qui, en fait, nous mettent dans des boucles de fonctionnement où on passe énormément de temps, alors que ce sont de très courtes vidéos.
Donc, plein de développement d’outils pour que les gens voient le maximum de publicités le maximum de temps et les voient avec des considérations qui les invitent à aller plus loin.
Cela fait qu’à la place d’être au service des personnes, de leur offrir quelque chose de qualité, on essaye de leur offrir quelque chose avec lequel on les tient captifs le maximum de temps et ça conditionne vraiment un pourrissement, des mauvaises pratiques, des services qui ne sont pas qualitatifs et de la presse poubelle. Il y a plein de conséquences très négatives qui viennent avec ça, avec toute la logique qui peut être appelée le capitalisme de l’attention en ligne.
L’informatique implique une forte complexité. À l’heure actuelle, le fonctionnement d’un ordinateur, le fonctionnement des réseaux, ce sont énormément de compétences différentes à plein d’endroits. Dès qu’on rajoute des surcouches de code, des surcouches d’informations, en fait on crée des vulnérabilités, on crée des voies d’entrée, on crée plein de choses.
Avec La Quadrature, on a pu dénoncer que toute l’organisation du système publicitaire au sens strict du terme, et puis de surveillance publicitaire, a effectivement rajouté une complicité très importante sur les usages qu’on a du Web. C’est-à-dire que tous les outils de surveillance qu’on a décrits, les cookies tiers, le profilage des navigateurs, les pixels invisibles, etc., tout cela ce sont plein d’éléments de code qu’on vient rajouter sur des pages et qui viennent, de fait, introduire du code qui vient d’autres entreprises. Quand on récupère des briques de code d’un tiers, elles viennent d’autres entreprises. Oui, elles peuvent avoir juste un intérêt de capter des données ou juste un intérêt de faire des trucs publicitaires, mais elles ont aussi un pouvoir d’action sur la page qui est affichée. Parfois, si le code n’était pas bien regardé, le bout de code peut venir non seulement avec du traçage publicitaire, mais aussi avec des trucs qui permettent juste, fondamentalement, de prendre le contrôle de la page d’administration sur lequel ce site est déployé ou des choses comme ça.
Les gens qui ont travaillé fortement sur les questions de surveillance publicitaire ont dénoncé le coût en sécurité que venait mettre le système publicitaire sur les usages d’Internet. On a des exemples vraiment récents qui témoignent bien des abus qui ont été envisagés depuis longtemps et qui ont été mis en œuvre depuis longtemps et, là, on a quelques entreprises qui se sont vraiment fait prendre la main dans le pot de la surveillance publicitaire à des fins encore moins légitimes que celles de la surveillance publicitaire. Des journalistes ont fait un petit travail d’investigation sur deux sociétés sœurs israéliennes, Patternz et Nuviad, qui, en gros, utilisaient les données publicitaires dans leur communication commerciale, autour de 500 000 applications pour smartphone, pour capter des données personnelles. En fait, ce que ces sociétés offrent derrière, ce n’est pas du ciblage publicitaire, c’est de la surveillance autoritaire, de la surveillance sécuritaire pour les États. Là, leurs clients ne sont pas des annonceurs, leurs clients ce sont les États qui ont besoin d’avoir des informations sur des personnes précises. Elles vont donc vous utiliser tout le système dystopique de surveillance publicitaire pour, derrière, refaire du ciblage étatique de personnes qui pourraient embêter des systèmes étatiques, parce qu’elles sont dans des formes de criminalité, le trafic de stupéfiants, le trafic de machin chose. L’entreprise Patternz est aussi liée, par son directeur technique, à une autre entreprise qui est la société NSO [5], qui a aussi fait beaucoup parler d’elle parce qu’elle vendait un logiciel espion à des gouvernements et à des personnes autoritaires qui permettait de prendre le contrôle des téléphones et, en fait, de savoir tout ce que faisait le téléphone, tout ce qui était échangé sur le téléphone, qui a donc pu être utilisé contre des personnalités politiques, contre des journalistes, contre des défendeurs des droits humains. Un gros travail a été fait pour dénoncer les pratiques abusives de la société NSO. Le directeur technique est le même que celui de Patternz et, là, des outils publicitaires sont utilisés. La géolocalisation publicitaire est utilisée à des fins d’identification des personnes, donc vraiment, un partenariat public/privé à des fins de surveillance autoritaire. Donc un mélange des genres absolument terrifiant et qu’on a dénoncé depuis le début. On a dit que les pratiques abusives des grandes entreprises du numérique ont comme conséquence des possibilités de contrôle, des possibilités de surveillance qui sont beaucoup trop importantes et qu’il faut vraiment bannir parce que leur coût sociétal, leurs risques en termes d’abus autoritaires sont vraiment trop graves. Là on parle de Patternz et Nuviad, mais, malheureusement, ce ne sont pas les seules entreprises à avoir testé ces stratégies-là.
On a eu aussi des déviances de ces outils de surveillance publicitaire, pas à des fins capitalistes, mais à des fins de propagande politique, donc des entreprises — la plus célèbre et qui a fait scandale c’est Cambridge Analytica [6] —, qui ont utilisé la surveillance publicitaire à des fins de manipulation, d’influence de scrutins électoraux, qui ont été utilisées dans le cadre de campagnes un peu célèbres, notamment celle du Brexit, notamment celle qui a vu gagner Donald Trump aux États-Unis, d’autres au Kenya ou dans d’autres pays où la situation politique était plus ou moins stable. En tout cas, des entreprises ont utilisé les données publicitaires pour envoyer la bonne propagande politique à la bonne personne, au bon moment. On a l’exemple de Cambridge Analytica, qui est beaucoup cité, où en gros, via des outils de manipulation publicitaire, on a envoyé une fausse annonce de propagande, que le pape aurait soutenu la candidature de Donald Trump, en utilisant toute l’infrastructure publicitaire pour agir sur l’élection étasunienne. Est-ce que le rôle de Cambridge Analytica a été vraiment le facteur premier dans l’élection de Trump ?, ce n’est pas clair du tout, ce n’est pas du tout sûr que cette propagande ait été si efficace que ça. En tout cas, ce qui est certain, c’est que ça a été fait, on a donc utilisé ces données de surveillance de masse des populations aussi à des fins de détournements d’opinion politique. Il y a des enjeux quotidiens – on peut parler Twitter –, des enjeux d’utilisation de ces outils et de ces pratiques de surveillance pour essayer de changer les opinions dans les pays. Il y a donc des questions géopolitiques, dans lesquelles, je pense, il n’est pas pertinent qu’on rentre, mais qui se jouent aussi quotidiennement avec ces outils publicitaires.
Cambridge Analytica était une entreprise fondée par des gens qui ont commencé à faire des recherches en psychologie sociale et sur différentes choses et qui se sont dit « il y a peut-être quelque chose à jouer dans le numérique ». Il y a donc des chercheurs scientifiques à la base, et leur première porte d’entrée dans l’exploitation de données, c’est notamment la diffusion sur Facebook de petits jeux et principalement de tests de personnalité, entre guillemets relativement « sérieux ». On pouvait savoir si on est plutôt extraverti ou introverti, si on aimait les découvertes, plein de choses autour des caractéristiques communes de psychologie. Du coup, quand on faisait le test, on donnait déjà énormément d’informations sur nous, qui on était et comment on pouvait être très facilement manipulé, parce qu’il y avait plein d’éléments importants de psychologie. En plus, ça utilisait les mécanismes de Facebook qui faisaient que les personnes qui diffusaient ce type de questionnaire ou ce type d’application sur Facebook pouvaient obtenir des droits assez importants, notamment obtenir les listes des contacts des personnes qui faisaient le test de personnalité. Par cela, on aspirait leurs goûts, leurs listes d’amis, etc., donc une obtention de données massives par ce biais-là au travers de Facebook, énormément de gens partageaient ça. Potentiellement aussi acheter des bases de données de courtiers en données pour en récupérer d’autres, donc une récupération de données publicitaires parasites à Facebook, mais ça arrangeait Facebook, parce que les gens avaient envie de revenir sur Facebook parce qu’il y avait des choses qui s’y passaient. L’intérêt économique direct de Facebook n’était pas là, ce n’était pas là où il gagnait de l’argent, mais le fait que les gens revenaient sur Facebook, ça avait un intérêt de leur côté.
Et comme ça, en fait en profitant un peu de cette matrice publicitaire, que cette entreprise a pu récupérer ces données et essayer, derrière, de les utiliser à des fins de propagande politique. Leur site Internet, c’était vraiment « on fait du marketing publicitaire classique et on fait de la propagande politique », c’était mis côte à côte sur leur site Internet, en grand, même bien avant qu’une personne qui avait travaillé pour Cambridge Analytica dénonce des trucs. Vraiment en gros, légalement, ils avaient violé certaines conditions de confidentialité de Facebook, ils avaient fait des choses ; leur activité était un peu connue et était déjà dénoncée avant que le scandale éclate. Ça incluait vraiment à fond cette logique de système publicitaire qui ne respectait pas le consentement, tout ce que Google et Facebook faisaient, par ailleurs, pour la publicité commerciale.
Les cinq GAFAM utilisent des données personnelles et posent problème. On a un duopole de deux entreprises fortes sur la publicité depuis longtemps, Google et Facebook. Ça a pu changer un peu ces dernières années, mais, globalement, l’essentiel des revenus de Google et Facebook, autour de 90 % ou plus, provient encore d’opérations publicitaires, ce qui peut être un peu moins le cas des autres GAFAM. Amazon, notamment via Twitch et d’autres mécaniques publicitaires, qui envoie des gens vers des liens affiliés et vers des consommations directes sur Amazon, a aussi quand même un gros système publicitaire et prend aussi la place dans le marché général de la publicité en ligne. Je n’ai pas le chiffre exact, mais, globalement, ces trois acteurs représentent une majorité du marché publicitaire en ligne et, en fait, captent aussi la majorité de l’évolution du marché de la publicité en ligne. Donc, peut-être autour de 60 % de tout le marché de la publicité en ligne, de toute l’économie de la publicité en ligne est capté par ces trois grands acteurs, et, en plus, tous les ans, les augmentations de marché, voire les captations de parts de marché, se renforcent autour de ce duopole, voire triopole avec Amazon.
Après, il ne faut quand même pas laisser de côté d’autres acteurs qui sont beaucoup plus petits, qui représentent beaucoup moins de revenus mais qui représentent aussi beaucoup de problèmes, qui sont ce qu’on appelle les courtiers en données. Ce sont des entreprises qui, par le biais de manœuvres un peu détournées, par exemple diffuser des éléments logiciels que les informaticiens et les informaticiennes ont diffusés tel quels, sans se fatiguer, vont aussi injecter des petits bouts de code qui vont permettre de tracer les usages, donc, comme ça, vont essayer de mettre des bouts de code à droite à gauche, pour, aussi, accumuler de la donnée, potentiellement la revendre aux grands acteurs, ou aussi faire du ciblage publicitaire. Par exemple, en France, on a un géant problématique sur cette question, qui s’appelle Criteo [7], qui a vraiment utilisé plein d’outils comme ça pour essayer d’accumuler le maximum de données et de les revendre à d’autres structures ou faire des logiques d’annonces.
Présentatrice : La publicité numérique est devenue le modèle économique à la base de l’activité sur Internet et de celle des grandes plateformes prédatrices.
En 2015, une étude commandée par la fondation Mozilla Firefox concluait que la pub représentait en moyenne 39 % du poids d’une page web et 44 % de son temps de chargement, soit un volume colossal de données et d’encombrement de bande passante, donc une consommation d’énergie importante directement liée à cette omniprésence publicitaire.
On a vu, dans ce premier volet d’épisode, qu’avec la collecte des données personnelles et le traçage en ligne des utilisateurs dans leur navigation, les méthodes de ciblage publicitaire ont évolué, se sont affinées et ont séduit de plus en plus d’annonceurs. Le marché de la publicité en ligne est devenu bien trop obnubilé par sa rentabilité pour se préoccuper des droits des personnes vivant derrière ces données.
Mais des formes de résistance se sont également développées face à cette situation. Les citoyens ont notamment créé et continuent de chercher des moyens pour que les utilisateurs puissent bloquer la pub sur Internet en développant des outils informatiques, les bloqueurs de pubs. D’autre part, il y a eu une première avancée sur le plan juridique pour encadrer le traitement des données personnelles sur le territoire de l’Union européenne, le RGPD [8], le Règlement général sur la protection des données qui est entré en application en 2018 et qui met en avant l’importance du consentement dans la collecte et l’usage des données personnelles. Marne et Nado nous parlerons de tout cela dans un deuxième volet.
Merci pour votre écoute et n’hésitez pas à partager cet épisode s’il vous a plu.