J’ai fait partie des centaines de milliers de passagers affectés par la récente erreur du système informatique de Delta Air Lines. Celle-ci a eu lieu le 8 août, et je devais prendre deux vols avec Delta ce jour-là. En fait, j’ai été plutôt chanceux : la compagnie n’a pas annulé mes deux vols, je n’ai pas raté le vol de correspondance, et j’ai passé moins de temps à attendre que les autres passagers : seulement cinq heures environ.
Au bout du compte, tout s’est bien terminé, et ces cinq heures ont été une expérience intéressante.
Que s’est-il passé ?
Delta Air Lines, l’une des plus grandes compagnies aériennes au monde, a une flotte de plus de 800 appareils qui réalisent environ 6 000 vols par jour et transporte plus de 100 millions de personnes par an. La société comporte 13 hubs, dont fait partie Atlanta, le plus grand aéroport au monde. Pour résumer, Delta a un système de hubs vraiment immense.
Le 8 août à 2 h 30, heure de l’Est, les serveurs du système informatique du centre de données de Delta Air Lines d’Atlanta ont été arrêtés à cause d’une coupure de courant. Les systèmes de duplication n’ont pas réussi à se connecter ou ont été dépassés et, suite à cela, tout le système informatique a cessé de fonctionner.
Hacking electricity, water, and food https://t.co/puKzqEPXTa #ICS pic.twitter.com/L4ibbptbXM
— Kaspersky (@kaspersky) July 15, 2016
Selon John Kraft, un porte-parole de Georgia Power (la société qui alimente le centre de données en électricité), le problème venait d’un appareillage de connexion. Un appareillage de connexion fonctionne comme un disjoncteur dans une maison ; il permet de contrôler et de faire passer des flux d’alimentation.
L’analyste de l’industrie et ancien gestionnaire de lignes aériennes Robert Mann a déclaré à Reuters que » la société réalisait sûrement un test de routine de son alimentation électrique de secours quand l’appareillage de connexion a sauté et empêché Delta d’accéder à ses générateurs de réserve. »
Par conséquent, 1 000 vols ont été annulés le 8 août et encore plus lors des jours suivants, alors que Delta s’efforçait de s’en remettre. La grande majorité des vols a été retardée.
En plus de l’impact sur les passagers, l’incident a touché des douzaines d’aéroports et augmenté la charge de travail d’agents d’exploitation du monde entier.
Bien entendu, le système minutieusement orchestré de vols connectés entre Delta Air Lines et ses partenaires a également souffert. De nombreux passagers ont dû séjourner dans des villes où ils ne devaient que passer brièvement.
Delta leur a offert la possibilité de renoncer volontairement au vol qu’ils avaient prévu et de rester dans la ville de départ pendant une journée aux frais de la société. De nombreuses personnes ont accepté. Delta a également promis 200 $ en bons de voyage à tous les clients dont les vols ont été annulés ou retardés de plus de 3 heures.
Delta cancels hundreds more flights: https://t.co/hm2gpzD1A1 pic.twitter.com/7iqXl7dW51
— Reuters Business (@ReutersBiz) August 10, 2016
Comment j’ai vécu cette journée
L’après-midi du 8 août a été le pire moment de la journée. C’est le moment où il y a eu le plus de problèmes, d’annulations de vols et d’attente. À ce moment, je me trouvais à l’aéroport international de Los Angeles, le cinquième aéroport le plus fréquenté au monde (environ 70 millions de passagers par an). Il ne s’agit pas d’un endroit calme même quand tout va bien.
Des choses bizarres se passaient. Mon vol vers Seattle a disparu du tableau des arrivées et des départs. L’application mobile de Delta était la seule à indiquer quand et où l’embarquement allait commencer.
Cependant, la porte d’embarquement changeait toutes les cinq minutes. J’ai compris que les personnes chargées d’assigner les portes ont dû remanier des centaines de vols entre des douzaines de portes, comme dans un jeu de Tetris géant avec la difficulté maximale.
Après avoir couru pendant une demi-heure à travers le terminal, je suis finalement arrivé à la porte qui était vraiment assignée à mon vol. Cette assignation n’était qu’un arrangement verbal : les employés des lignes aériennes restaient en contact en utilisant de bons vieux téléphones.
J’ai mis plus de deux heures pour pouvoir monter dans l’avion, et j’ai dû attendre deux heures de plus avant que l’avion ne décolle.
Pendant le délai de cinq heures, je n’ai pas pu m’empêcher d’apprécier le comportement professionnel des employés de la ligne aérienne. Ils ont fait de leur mieux pour atténuer les impacts de la panne. Ils ont fait preuve d’une grande patience alors qu’ils expliquaient aux passagers ce qui se passait et s’excusaient pour le dérangement causé, toujours calmement, poliment et chaleureusement. Aucun employé ne s’est montré malpoli, ni n’a ignoré les questions, bien qu’ils aient tous bien d’autres choses à faire.
https://twitter.com/ParachuteTent/status/758979833107927040
Conclusions
Lorsqu’un système informatique comporte une erreur, nous devons retourner aux anciennes méthodes qui semblent non seulement totalement inefficaces, mais sont aussi impossibles à utiliser de nos jours ; elles ne sont pas faites pour gérer le trafic moderne. Dans ces cas, nous n’avons rien d’autre à faire qu’espérer que les systèmes électroniques soient rétablis le plus vite possible.
Que pensez-vous des villes entièrement connectées ? Faut-il s'en inquiéter ? #smartCities https://t.co/TrVnXkqY6N pic.twitter.com/lhCBSdn9fO
— Kaspersky France (@kasperskyfrance) August 10, 2016
Que peut-on faire ? Devrait-on abandonner les systèmes électroniques parce qu’ils manquent parfois de fiabilité ? Bien sûr que non. Aucune société ne peut être compétitive sans les technologies modernes. Les voitures et les camions sont dangereux, mais personne ne suggère de transporter nos biens et de voyager à cheval !
Ce que nous devons faire, c’est apporter le plus d’attention possible à la sécurité et la fiabilité. Les systèmes électroniques que nous utilisons pour gérer le fonctionnement d’infrastructures critiques devraient être protégés de manière appropriée des incidents et des attaques. Cet exemple est un rappel important de l’impact immense que toute panne sérieuse d’un système informatique industriel peut avoir sur les vies de centaines de milliers de personnes, sans parler des pertes financières.