Rapport d'incident #004 (01/11/2023)
Coupure d'électricité à la Cyberrance
Hier à 13h le serveur n'était plus accessible. C'est en allant voir nos emails d'alerte que la situation s'éclaircit, ll s'agit en fait d'une coupure d'électricité prolongée à la Cyberrance :
Heure | Sujet |
---|---|
12:22 | UPS eaton-5p@localhost on battery |
12:48 | UPS eaton-5p@localhost on line power |
12:52 | UPS eaton-5p@localhost on battery |
12:59 | UPS eaton-5p@localhost battery is low |
12:59 | Auto logout and shutdown proceeding |
Comme on peut le voir, l'onduleur a très bien rempli son rôle. Il a réussi à encaisser la première coupure de 12h22 à 12h48 sans broncher. Mais peu après, une nouvelle coupure est venue à bout de la capacité de sa batterie, il a donc envoyé au serveur un signal d'arrêt, afin qu'il séteigne de lui-même, proprement.
C'était la première fois que ce scénario se produisait et qu'il mettait à l'épreuve notre configuration d'arrêt automatique et tout s'est déroulé comme prévu !
Après avoir contacté des personnes sur place, nous apprenons que la coupure risque de perdurer encore quelque temps et nous n'étions pas certains du temps qu'il faudrait pour rétablir le courant.
Pour rappel, l'hébergement du serveur à la Cyberrance nous avait été proposé en dépannage lorsque la connexion Internet à Pantin était coupée. Il était prévu pour être temporaire, le temps que l'infrastructure fibre soit réparée. Celle-ci a finalement été réparée le 13 septembre (soit un peu plus de 3 mois après le début de la panne et presque 2 mois après le déménagement), mais nous n'étions pas non-plus particulièrement pressés pour rapatrier le serveur dans son placard.
La coupure de courant a finalement joué le rôle d'élément déclencheur, car ce jour étant férié, nous étions justement disponibles pour déménager à nouveau le serveur :
- 15h30 : On se met en route pour Romainville.
- 16h00 : Déconnexion et chargement du serveur dans la camionette.
- 16h30 : Remontage du serveur dans son armoire rack.
- 17h00 : Reconfiguration du serveur à cause du changement d'adresses IP.
- 17h30 : Configuration terminée, reste à attendre la "propagation" de nos modification DNS.
- 22h00 : Les informations DNS de club1.fr sont globalement cohérentes et le service est entièrement rétabli.