Delphine Sabattier : Pour commenter cette panne qui a frappé Instagram, WhatsApp, Facebook et sa messagerie, toute cette galaxie qui appartient au groupe de Mark Zuckerberg qui était inaccessible pour des millions, voire des milliards de personnes. On a parlé de cinq millions de signalements de problèmes rien qu’au début de cette panne, la première heure, et cette panne a quand même duré plus de six heures. C’est un événement sans précédent qu’on va décrypter avec deux experts : Benoit Grunemwald qui est expert en cybersécurité pour ESET France & Afrique francophone à mes côtés en plateau, et par Skype nous avons Stéphane Bortzmeyer, ingénieur en réseaux informatiques, expert R&D à l’Afnic [Association française pour le nommage Internet en coopération] qui est l’association chargée de gérer le registre des noms de domaine en France.
Oui, parce qu’on va parler de cette question de la structure d’Internet et de la gestion des noms de domaine qui est visiblement au cœur de ce qui s’est passé hier soir.
Déjà, Benoit Grunemwald, je voulais vous poser cette première question : est-ce qu’on peut exclure totalement le fait que cette panne Facebook soit liée à une cyberattaque ?
Benoit Grunemwald : On peut exclure le fait que la panne en elle-même soit liée à une cyberattaque, par contre on peut se poser des questions sur la raison pour laquelle il y a eu cette panne, notamment les actions qui ont été entreprises par les équipes Facebook pour mettre à jour les différents systèmes qui concernent le système DNS [1] et le système de routage.
Delphine Sabattier : On a eu une petite explication très rapide de la part de Facebook, donc explication officielle, ce serait lié à un changement de configuration de ses serveurs.
On va passer la parole à Stéphane Bortzmeyer qui est vraiment une pointure en matière d’infrastructure d’Internet. Que savez-vous aujourd’hui des raisons de cette panne ? Que pouvez-vous nous expliquer ?
Stéphane Bortzmeyer : Sur les raisons fondamentales, on ne sait que ce qu’a raconté Facebook. On peut observer ce qui se passe, on peut voir ce qui se passe à l’extérieur, mais on est forcé de croire ce que raconte Facebook concernant les raisons derrière ; il n’y a pas d’enquête indépendante dans ce genre de panne. Ce que dit Facebook c’est qu’ils ont changé la configuration de leurs routeurs, les machines spécialisées qui annoncent à tout le reste de l’Internet comment joindre Facebook et qui acheminent ensuite les communications ; ils ont changé la configuration. Soit il y avait une erreur dans la configuration, soit ce changement a déclenché une panne, a révélé une bogue latente et Facebook n’était plus joignable, plus joignable du tout, un peu comme si elle était sur une île dont on avait fait sauter les ponts qui la reliaient au continent.
Delphine Sabattier : Pour expliquer effectivement ce problème de protocole de routage, en fait, d’Internet, c’est donc un problème de DNS, d’adressage de noms de domaine qui est la spécialité de l’Afnic. Donc on traduit une adresse URL – quand on tape dans son navigateur facebook.com, par exemple – en une adresse IP qui devient compréhensible par les machines et les serveurs. Est-ce que ce type de panne, qui dure six heures, c’est compréhensible ?
Stéphane Bortzmeyer : C’est tout à fait compréhensible, il n‘y a pas de raison. Les erreurs arrivent, les problèmes arrivent et puis c’est difficile aussi de se mettre en mode crise. Au début tout le monde est stressé, il faut un certain temps pour se calmer, comprendre ce qui se passe, définir un plan d’action, le mettre en œuvre. Selon certains témoignages l’infrastructure interne de Facebook était elle-même inutilisable à tel point que, selon certains témoignages que je n’ai pas vérifiés, mêmes les badges d’accès aux bâtiments ne fonctionnaient plus, les contrôles d’accès aux bâtiments dépendaient aussi des systèmes qui étaient en panne, donc les gens ne pouvaient plus rentrer. Donc c’est tout à fait compréhensible, les choses arrivent. Je rappelle qu’il ne s’agit pas d’une centrale nucléaire, ce n’est que Facebook, ça n’est pas dramatique qu’il y ait eu une panne de longue durée.
L’origine de la panne, semble-t-il, ne venait pas à l’origine du DNS, du système des noms de domaine, mais c’est simplement que le DNS est la première chose qu’il y a quand on se connecte, quand vous vous connectez effectivement à Facebook, à part le nom de domaine facebook.com, il faut récupérer un certain nombre d’informations techniques dont les logiciels ont besoin, ça passe par des requêtes DNS. Du fait que c’est le premier qu’on utilise, les problèmes se manifestent en premier par un message d’erreur mettant en jeu le DNS, les noms de domaine. Il semble bien que dans ce cas-là la cause racine ne venait pas du DNS, mais c’est par le DNS qu’on l’a observée en premier.
Delphine Sabattier : On parle d’un changement de configuration des serveurs qui serait lié aux fuites qui sont passées par voie de presse, d’abord dans The Wall Street Journal et ensuite sur CBS News puisqu’une lanceuse d’alerte [2] a diffusé des documents internes. Il y aurait aussi une diffusion des comptes d’accès d’administration. Est-ce qu’en mode panique, je dirais, Facebook a dû changer les clefs d’administration ? Est-ce qu’il y avait un surplus d’accès par ces comptes d’administration ? Peut-être qu’il y a derrière la peur ou la prévention d’une cyberattaque ?
Benoit Grunemwald : Certainement. On pense que les administrateurs de Facebook, au vu des annonces récentes, ont pris les devants pour pouvoir anticiper soit un grand nombre d’attaques soit un grand nombre d’accès à leur système. Tout en sachant que le fait qu’il y ait beaucoup de télétravail et qu’il y ait des accès compliqués notamment aux datacenters, que ceux-ci peuvent être loin, ne facilite pas le travail des administrateurs à partir du moment où ils perdent les accès. Ce qui veut dire que, suite à cette mise à jour, eux-mêmes ont perdu un certain nombre d’accès et ils n’ont pas dû pouvoir résoudre le problème à distance mais bien devoir se déplacer très certainement sur les sites pour aller remettre en fonctionnement des équipements qui sont vraiment à la fois peu nombreux, très spécifiques, parce que ce type d’équipement est réservé à des très grandes entreprises, voire des fournisseurs d’accès à Internet.
Delphine Sabattier : C’est une panne plutôt rare à laquelle on a assisté, Stéphane Bortzmeyer ?
Stéphane Bortzmeyer : Non ! Il y a tout le temps des pannes. Autant l’Internet lui-même n’est jamais en panne, autant localement, des pannes ça arrive sur tel service ou tel autre, si vous gérez des pannes. La seule chose qui est un peu inhabituelle dans celle-là c’est la durée de la panne. En général ce genre de problème se répare entre une et deux heures le temps qu’on analyse le problème, qu’on trouve une solution, qu’on la déploie. On a des fois vu des pannes plus longues sur d’autres services peut-être moins connus que Facebook. Il y a aussi une part de perspective. Quand le domaine national turc, .tr, a été en panne pendant plusieurs jours il y a quelques années, ça n’a pas fait la une de la presse internationale. C’était certainement beaucoup plus grave et beaucoup plus important qu’une panne de Facebook, mais évidemment, quand ça se passe aux États-Unis, ça bénéficie toujours d’un impact médiatique supérieur.
Non !, des pannes ça arrive et, je le répète, Facebook n’est pas une ressource critique, ce n’est ni un hôpital ni une centrale nucléaire.
Delphine Sabattier : Il y a quand même des impacts business, mais bon !, ce n’est pas le sujet de notre talk tout de suite. Ça pose aussi la question de la résilience de ces grandes plateformes du numérique.
Benoit Grunemwald : Complètement. Ça pose à la fois la résilience des grandes plateformes, mais également des entreprises. Je pense qu’on peut en tirer des enseignements. J’imagine que Facebook est déjà en train de tirer des enseignements. Les autres équipes qui gèrent ce type d’équipement dans les grandes entreprises, elles aussi analysent et vont certainement capitaliser sur les dysfonctionnements qui ont été commis.
Et puis ça peut nous amener à réfléchir nous-mêmes à la fois en tant que particuliers mais également entreprises sur les éléments que l’on met en place pour faire face à des situations qui sont souvent inextricables ou qui semblent très compliquées de prime abord. Il faut réfléchir à la façon dont on va pouvoir, par exemple, contacter ses collaborateurs s’il y a un problème sur une messagerie A que l’on utilise au quotidien et pouvoir passer rapidement sur une messagerie B, tout en ayant quand même à la fois ses collaborateurs disponibles sur cette messagerie. Il y a un certain nombre d’enseignements que l’on peut tirer pour les entreprises.
Delphine Sabattier : C’est là où les enseignements ça peut être aussi de s’exercer à des moments de crise, comme ça, assez critiques. J’imagine que chez Facebook ils sont exercés quand même !
Benoit Grunemwald : Oui. Mais peut-être que justement ce petit impondérable, ce petit moment imprévu, leur permettra d’améliorer leur scénario de crise pour les prochains entraînements.
Delphine Sabattier : Une toute dernière question très rapidement Stéphane Bortzmeyer : est-ce que vous voyez un lien entre ce qui s’est passé hier sur l’ensemble des sites et des plateformes de Facebook et les ralentissements qui auraient été constatés également sur Twitter ?
Stéphane Bortzmeyer : Probablement pas. Mais il peut y avoir des effets indirects. Par exemple, les gens qui opèrent des gros résolveurs DNS publics comme Google avec son service 8.8.8.8 ou Cloudflare avec le 1.1.1.1 ont observé des problèmes parce que tout un tas de machines réessayaient tout le temps et reposaient tout le temps des questions sur facebook.com. Quand c’est un gros service très utilisé ça peut impacter les autres, les ondes se propagent, les ondes de problèmes se propagent, mais autrement non, pas forcément. Après il est possible que des tas d’utilisateurs de Facebook aient migré vers Twitter et que ça soit ça qui explique le ralentissement. Il n’y a encore rien de dramatique. Twitter c’est du bavardage. On a eu un petit peu plus de problèmes pour bavarder, c’est tout.
Delphine Sabattier : Absolument, vous avez raison. D’ailleurs il y a d’autres applications qui ont profité de cette crise chez Facebook. On continuera d’en parler dans le débrief de Smart Tech cette semaine, bien évidemment.
Merci beaucoup Stéphane Bortzmeyer, expert R&D à l’Afnic pour vos explications techniques et Benoit Grunemwald, expert cybersécurité chez ESET également pour vos décryptages.