La durée d’indisponibilité est une chose choisie. La gestion du problème par Atlassian en est une autre. Dans les deux cas, il y a des choses à redire.
À la racine, il y a une erreur de maintenance. Le responsable : un script destiné à supprimer les données associées à un brancher obsolète sur Jira (logiciel de suivi de projets). Il n’a pas fonctionné comme prévu ; supprimant en l’occurrence, chez les utilisateurs imaginés brancher, toutes les données du site Atlassian.
D’après la version officielle, il y a des soucis à deux niveaux. D’une part, l’équipe commanditaire a communiqué l’équipe exécutante de mauvais identifiants de ressources. De l’autre, les scripts ont été exécutés en mode « suppression permanente » alors que celle-ci aurait dû être temporaire.
Les premières perturbations se sont faites connaître lundi 4 avril. Sauf un court tweet du 7 avril, il a fallu attendre plus d’une semaine pour qu’Atlassian évoque publiquement le problème. D’abord par la voie de son CTO. Entre-temps, les clients touchés n’ont pas tous semblé trouver leur contenu dans les e-mails qu’on leur a envoyés. Ou sur la page de statut des services Atlassian, où le même message s’est peu ou prou répété au fil des jours.
Le 12 avril, Atlassian estime que la restauration de l’ensemble des sites endommagés (« environ 400 clients ») pourrait prendre encore jusqu’à deux semaines. Il n’en a finalement fallu qu’une, à la faveur de l’optimisation de la procédure : traitement en lots, parallélisation, automatisation…
Atlassian défend sa dernière option sur site
Atlassian promet un processus de restauration « en quelques heures » sur son édition Cloud. Mais cet engagement apparaît applicable uniquement lorsqu’il s’agit de faire une récupération de l’ensemble des locataires hébergés sur un magasin de données. Pour en récupérer uniquement certains, il faut le faire à la main. Sinon, on pénaliserait les clients non touchés – qui se retrouveraient au même niveau que les autres, à savoir un instantané pris avant l’incident.
En toile de fond, la transition d’Atlassian vers le modèle cloud. Depuis février 2021, l’éditeur ne vend plus de licences Server pour ses produits (il en assure le support jusqu’en février 2024). Ne reste plus qu’une option on-prem : Data Center. Plus complète, mais aussi plus chère : à partir de 27 000 $/an maintenance incluse pour Confluence, de 42 000 $ pour Jira, etc.
« Je suis content d’avoir obtenu une des dernières licences [Server] », commente un client dans le contexte de l’incident. D’autres intimant Atlassian à revoir ses plans… sans réponse de l’intéressé, sinon un lien vers la feuille de route pour l’édition Data Center.
En matière de SLA, Atlassian accorde des compensations sous la forme de remises. Elles varient selon le niveau de support.
Illustration principale ©