Panne mondiale des réseaux sociaux : Facebook s’explique

Panne mondiale Facebook : Une commande d’ingénieurs a accidentellement déconnecté le réseau de l’entreprise du reste du monde, selon un article de blog.

Facebook a déclaré qu’une erreur lors de la maintenance de routine du réseau, a provoqué une panne mondiale. Ces derniers ont ensuite entraîné, l’arrêt de ses plateformes pendant plus de six heures lundi.

Dans un billet de blog publié mardi, Santosh Janardhan, vice-président de l’ingénierie, a déclaré que la panne mondiale qui a vu Facebook, Instagram et WhatsApp s’éteindre pour des milliards d’utilisateurs a commencé lorsque les ingénieurs de l’entreprise ont émis un ordre qui a involontairement déconnecté les centres de données de Facebook du reste du monde.

Janardhan a décrit l’erreur comme provenant de la « dorsale mondiale » de la société. Elle est constituée de câbles en fibre optique et de centres de données.

« Cette panne a été déclenchée par le système qui gère la capacité de notre backbone mondial », a écrit Janardhan.  » Le backbone est le réseau que Facebook a construit pour connecter toutes nos installations informatiques, qui consiste en des dizaines de milliers de kilomètres de câbles en fibre optique traversant le monde et reliant tous nos centres de données.  »

 » Au cours de l’un de ces travaux de maintenance de routine, un ordre a été émis pour évaluer la disponibilité de la capacité de la dorsale mondiale. Ceci a involontairement interrompu toutes les connexions de notre réseau dorsal, les déconnectant effectivement. Les centres de données de Facebook dans le monde entier « , a déclaré Janardhan.

 

panne mondiale

 

La société a déclaré que ses systèmes étaient conçus pour vérifier les commandes afin d’éviter les erreurs. Mais l’outil de vérification a rencontré un bogue. En effet, il n’a pas réussi à arrêter la commande à l’origine de la panne. La panne a détruit les outils que les ingénieurs utilisent normalement pour enquêter et réparer de telles pannes, ce qui rend la tâche encore plus difficile.

La panne a été la plus importante jamais observée par Downdetector, une société de surveillance du web.

Facebook a déclaré qu’elle n’était pas due à une activité malveillante.

 

Panne au niveau de tous les réseaux sociaux :

Alors que les utilisateurs ont perdu l’accès à l’une des applications de messagerie les plus populaires au monde – WhatsApp compte plus de 2 milliards d’utilisateurs – les employés ont également été bloqués dans les outils internes.

La société a déclaré avoir envoyé une équipe d’ingénieurs sur le site de son centre de données. Ceci pour tenter de déboguer et de redémarrer les systèmes.

Cependant, il a fallu plus de temps à l’entreprise pour amener les ingénieurs à l’intérieur pour travailler sur les serveurs. Cela en raison de la sécurité physique et du système en place.

Même après avoir rétabli la connectivité du réseau aux centres de données, Facebook a déclaré qu’elle craignait que l’augmentation du trafic ne fasse planter ses applications.

L’entreprise avait organisé des exercices pour se préparer à de telles situations. L’accès à ses services est donc revenu relativement vite.

« Chaque échec comme celui-ci est une occasion d’apprendre et de s’améliorer », a écrit Janardhan.