28 et 29 août 2012 : Intervention de Philippe Chicaud sur l’incident réseau du 6 juillet 2012
Rédigé le . Publié dans CSEC UES Orange.
Présentation de Philippe Chicaud :
La panne du réseau mobile FT est intervenue le VENDREDI 06 JUILLET vers 15H00 – avec un rétablissement 22H30 de la voix et des SMS ; Data rétablie vers 3 H30 heures du lendemain matin.
La panne n'a pas été totale, 10% du trafic était écoulé au plus fort de la panne
Équipement en cause assez vite identifié : NGHLR, ensemble de 27 plate formes qui gèrent l'authentification des mobiles, en relation avec 6 bases de données (triplées pour secours) Ensemble de machines reliées entre elles via réseau IP.
La décision a été prise d'isoler la chaine data à partir de 22H15, ce qui a permis de rétablir le service voix et SMS.
Point presse le samedi AP annonçant des mesures de dédommagement,
Stéphane Richard a été auditionné à l'Assemblée nationale, au Sénat et à l'Arcep.
Après coup, cet incident est parfaitement compris (saturation d'un fichier de log qui s'est propagée et a étouffé l'ensemble du NGHLR).
Intervention de la CFE-CGC/UNSA (avec, en regard,les réponses de la Direction) :
- Les services d'urgence continuaient ils de fonctionner - FT : OUI, on peut appeler sans carte SIM
- Pensez-vous que la maitrise progressive de nos équipements techniques par les prestataires a atteint ses limites : n'aurait on pas une meilleure réactivité si on reprenait l'exploitation de ces machines - FT : la construction du réseau est le métier des industriels ; NGHLR est un équipement pas conçu spécifiquement pour FT ; on a en interne des compétences très élevées qui permettent de discuter avec nos fournisseurs
Sinon, si nous n'avions pas eu les compétences internes, la panne aurait été rétablie en plusieurs jours au lieu e plusieurs heures.
- Suite à cette panne quelles sont les mesures que vous comptez mettre en œuvre - FT : sur la gestion de la crise, il y a eu des soucis au niveau de la logistique des PC de crise ; les N°s de mobiles pour appeler les différents intervenants n'étaient de fait pas opérants.
La cause racine a été éliminée, mais les phénomènes de défense qui n'ont pas bien fonctionné doivent être améliorés.
- L'architecture elle-même du réseau technique sera-t-elle revue afin que ce type d' « hémorragie » ne puisse plus se reproduire - FT : Alcatel fournit un outil complémentaire avec alarme pour le cas où le fichier source se remplirait de nouveau trop vite?
- Y aura-t-il des impacts sur le déploiement du LTE (4G) ? Ce déploiement est-il étanche ? - FT : quand on a compris le problème, on a dégelé les opérations sur la partie basse de réseau qui n'a rein à voir (opérations de Swap reprises).
- Quels sont les coûts induits par cette panne - FT ; oui, plusieurs dizaines de millions d'€ + cout en terme d'images ...
- Quels vont être les impacts de la médiatisation de cette panne sur notre stratégie marketing basée sur la qualité de notre réseau ?
- des pénalités ont-elles été demandées à Alcatel - FT : en cours, événement grave pour Alcatel l'entreprise a été très réactive
- Une hausse des résiliations a-t-elle été enregistrée suite à l'évènement - FT : aucune corrélation
- impacts sur la médiatisation sur la stratégie marketing basé sur al qualité du réseau - FT : il est ancré dans l'esprit des personnes que le risque zéro n'existe pas, ce qui est important c'est la qualité de la réaction + la qualité de couverture et de fonctionnement du réseau.
- Comment comptez-vous justifier désormais notre premium de prix ?
- Face à ce type d'accident industriel il y a 2 stratégies, la première s'excuser et dédommager, la deuxième s'excuser et placer encore plus haut la promesse de marque !
- Pourquoi ne pas avoir choisi de placer notre promesse sur une posture du type "plus jamais cela" FT : Orange mets en place désormais une procédure qui ouvrira automatiquement et librement tous nos hot spot à la Voip si par malheur le réseau GSM tombe ainsi nos clients resterons en permanence joignables ?