site web forum documentation

CLUB1.FR

🇬🇧

Rapport d'incident #003 (05/06/2023)

Panne au niveau de l'infrastructure fibre du quartier

Le lundi 5 juin à 9h00 nous recevons une alerte de notre système de monitoring nous informant que l'ensemble des systèmes de CLUB1 sont interrompus. Comme c'est souvent le cas, il s'agit d'une panne au niveau de la connexion à Internet, l'ensemble du materiel et du logiciel du serveur se comportant correctement. Habitués à ce genre de panne, nous espérions un retour à la normale après quelques heures.

shema fibre jolis nro pmz

Schéma de l'infrastructure fibre optique autour du serveur CLUB1.
Les lignes orange correspondent à l'infrastructure mutualisée, gérée par l'opérateur d'infrastructure (du PM au PRI, inclus). Tout ce qui est bleu est géré par Bouygues Telecom et en rose par CLUB1. Les PBO sont sous la responsabilité de l'immeuble et les PTO sous celles des FAI (aussi appelés opérateurs commerciaux).
Schéma d'origine provenant du blog uniformatic.

Mais après 5 heures la connexion n'était toujours pas rétablie. Nous décidons de tenter de redémmarrer plusieurs fois la box de notre FAI (Bouygues Telecom) et le point de terminaison fibre mais rien n'y fait. Nous contactons alors Bouygues pour déclarer l'incident et obtenir plus d'informations.

Sur le portail de gestion de la ligne, Bouygues nous informent qu'ils sont déjà au courant de l'incident :

Un incident impactant l'ensemble de vos services est en cours. Nos équipes sont mobilisées pour le résoudre. Merci de laisser vos équipements branchés.

Lors de la déclaration, plus d'informations nous sont ensuite présentées. Il s'agit visiblement d'un incident généralisé au quartier, comme l'indique le site de Bouygues :

Détection d'un incident global

Un dysfonctionnement collectif a été déclaré sur votre zone. Merci de laisser vos équipements branchés.

Prochaine Action

Le traitement du dysfonctionnement collectif est en cours. Vous serez bientôt informés de la prochaine étape.

Nous recevons également le SMS suivant apportant quelques informations supplémentaires :

L'incident sur votre Bbox ne vient pas de chez vous, mais nécessite une intervention sur notre réseau. Nos techniciens sont mobilisés et vos services devraient etre rétablis le 19-06-2023 00:00:00. Pensez à laisser vos équipements branchés pour leurs diagnostics.

La date de rétablissement annoncée du 19 juin, soit deux semaines plus tard n'augurait rien de bon. Le lendemain, nous avons donc contacté notre FAI par téléphone pour obtenir plus d'informations.

Il s'agit en fait d'une panne au niveau de l'opérateur d'infrastructure fibre, sur laquelle Bouygues n'a donc pas la capacité d'agir directement. Notre interlocuteur nous a également confirmé que la date donnée pour dans deux semaines était arbitraire et qu'il était possible que l'incident se résolve plus rapidement. Quoi qu'il en soit, toute l'infrastructure fibre du quartier était belle et bien hors-service ce qui affecte donc tous les FAI commerciaux qui l'exploitent.

Un petit tour sur la carte des déploiements fibre de l'ARCEP nous permet de vérifier qui est l'opérateur d'infrastructure dans notre quartier. Dans notre cas, il s'agit d'Orange.

carte arcep fibre par commune : Pantin
La carte des déploiements fibre de l'ARCEP en vue par communes.

On peut voir qu'il y a deux opérateurs d'infrastructure à Pantin : Orange et SFR.

carte arcep fibre immeubles
La vue rapprochée permet d'avoir les informations par immeuble (chaque petit point) !

Le mercredi 14 juin nous recontactons Bouygues Telecom pour essayer à nouveau d'obtenir un peu plus d'informations car l'attente commençait à se faire longue. Cette fois le conseiller nous a certifié que la connexion ne serait pas rétablie avant le 19 juin. Nous espérions qu'il puisse au moins nous donner l'état d'avancement de la réparation, mais il n'avait pas beaucoup plus d'informations que nous n'en avions déjà, mis à part que l'incident affectait 58 clients Bouygues et qu'elle était causée par la panne de deux points de mutualisation (PM) au niveau d'Orange.

récapitulatif de l'uptime des derniers jours
Ces 6 semaines de coupure de CLUB1 seront plus tard surnommées les "six semaines noires d'Internet".

Suivi de l'incident

Bouygues Telecom ne fournissant aucune mise-à-jour de la situation, Nicolas a tenté de suivre la panne via une succession d'appels téléphonique. Malheureusement, ils participent surtout à augmenter la frustration car il n'y a aucun dialogue possible et le FAI nous fait sentir le peu de considération qu'il a pour nous et ses 57 autres clients.

19/06 18:51

  • Pas de retour d'internet ni de message de Bouygues.
  • Redémarrage de l'ONT : son voyant LOS n'est plus allumé en rouge et les trois autres sont verts, la box n'arrive cependant toujours pas à recevoir une adresse IP.
  • Déplacement de la date butoir au 23 Juin.

20/06 15:44

  • Appel infructueux : "il y a eu des complications".

21/06 16:29

  • Déplacement de la date butoir au 26 Juin.
  • Bouygues renvoie la responsabilité à Orange : "d'après Orange, le signal obtenu après réparation était de trop mauvaise qualité et il fallait donc rerouter les fibres"
  • Entre temps, on apprend que les clients Orange ont retrouvé un accès internet dans la résidence.

27/06 16:53

  • Déplacement de la date butoir au 3 Juillet.

04/07 19:02

  • Aucune intervention n'a finalement eu le lieu le 3 Juillet.
  • Information d'une nouvelle intervention le 10 Juillet.

17/07 16:56

  • Pas de nouvelle date d'intervention prévue.
  • Visiblement pas d'intervention le 10 Juillet.
  • Un voisin aurait eu l'information officieuse que le service ne risquait pas d'être rétabli de sitôt.

19/07 20:30

Bilan et retours d'expériences

Voici un petit bilan à chaud de cette expérience :

Culpabilité et frustration

À la base de CLUB1, il y a la volonté d'expérimenter l'auto-hébergement en recyclant une connection à internet d'habitation particulière. En profitant notamment de la qualité et de la symmétrie du débit qu'apportent les connections via fibre optique. De part ce positionnement, les problèmes venant de cette connection sont hors de la portée de CLUB1.
Le vrai risque de ce genre de panne, est de faire naître un sentiment de culpabilité chez les personnes qui se sont impliquées dans le bon fonctionnement du serveur. Hors il est primordial dans un projet bénévole tel que le notre, que les membres se sentent bien.

Dans un premier temps, l'idée était donc de ne rien faire, d'attendre que la connection soit rétablie.
Seulement, plus la panne perdure, plus le sentiment de frustration grandit. Il faut dire que nous n'avions pas imaginé de telles durées pour des pannes qui englobent autant de personnes (toute une résidence). Le fait de n'avoir aucune date de rétablissement annoncée et, pire, qu'elle se déplace sans cesse, n'aide pas non plus à prendre des décisions.
C'est pourquoi nous avons mis autant de temps avant de changer de stratégie, de passer à l'action en déménageant le serveur à la Cyberrance.

Communication

C'est la double peine ! Non seulement nous perdons nos espaces de diffusion, mais également une partie de nos outils de communication et de prise de décision (notre Forum, Matrix et les Emails). Heureusement, nous avons une liste d'emails indépedants du serveur prévue à cet effet. Mais ce système de secours est archaïque : seul une poignée de membres peut écrire au reste du groupe.

💡 Piste de solution : Ticket concernant l'utilisation d'un service de mailing list externe sur notre forum.

Faire du matériel avec du vide

Pour nous qui tentons de rendre internet plus matériel aux yeux de ses usagers, le fait que des sites web ne soint pas toujours accessibles peut avoir un intérêt. Cela permet de casser la virtualité induite par le 100% disponible. Comme dans notre monde concret, où les choses se cassent, ferment, vieillissent. C'est exactement l'idée du site web du Low Tech Magazine, qui est alimenté par énergie solaire uniquement.

Actuellement, lorsqu'un site web est hors ligne suite à une telle panne, l'URL (par exemple https://club1.fr) nous amène vers le néant. Une page qu'il faut attendre indéfiniment. C'est frustrant, mais ça ne raconte pas grand chose. Si l'on pouvait envoyer un message d'erreur de notre cru, situant la panne et son contexte, cela participerait à rendre plus visible l'infrastructure d'internet. Et peut être que la frustration laisserai sa place à d'autre sentiments.
Cette idée pose cependant un problème technique, car pour pouvoir renvoyer un tel message, il faut... un serveur. 😅

👀 Voir le ticket correspondant sur notre forum.

Off line first

Perdre l'accès à ses données en ligne renvoie forcément à se questionner sur sa dépendance aux services en ligne. La coupure que nous avons vécue va pouvoir alimenter les réflexions à ce sujet. La philosophie Off line first prend tout son sens dans ces moments là. Elle nous rappelle qu'il est bon d'avoir ses fichiers en local pour se sentir équipé quoi qu'il arrive !

"Si on ne peut pas amener les fichiers aux membres CLUB1, il suffit d'amener les membres au serveur."

— Einstein 🐶

Une autre technique consiste à venir en personne voir le serveur pour y réccupérer ses données en mains propres. Et en plus, on gagne un petit café ! L'étape suivante c'est bien-sûr les clefs USB sur pigeons voyageurs. 🐦

🐸 Votre ressenti nous intéresse !!

Que vous soyez membre de CLUB1 ou non, on est curieux·se de savoir ce que cette panne de 6 semaines vous a fait ressentir, quelles émotions vous ont traversées pendant tout ce temps.

Pour cela, envoyez nous un email à 6semainessans@club1.fr !

⚠️ On souhaiterait repartager ces ressentis sur notre site web, mais si ça vous gêne, merci de l'indiquer dans l'email.

📫 Envoyer une carte postale au serveur

Et si vous voulez juste partager le bonheur de retrouver CLUB1 en ligne, c'est aussi possible. On vous propose d'envoyer une carte postale au serveur CLUB1 ! On la diffusera ensuite sur une page dédiée du site 🏤.

Voici sa nouvelle adresse :

CLUB1
93 Rue de la Liberté
93230 Romainville

Cet article à été consulté 1282 fois