Aller au contenu

Mesure et amélioration

Évaluer la performance du change management avec les métriques DORA, conduire les post-implémentation reviews et construire une boucle d'amélioration continue.


Métriques DORA

Les DORA metrics (DevOps Research and Assessment) sont les quatre indicateurs les plus valides scientifiquement pour mesurer la performance des livraisons. Deux d'entre eux concernent directement le change management.

Change Failure Rate (CFR)

Le taux d'échec des changements mesure la proportion de deployments qui necessitent un rollback, un hotfix ou causent un incident.

CFR = nombre de changements ayant cause un incident / nombre total de changements
Performance CFR Interpretation
Elite < 5 % Processus mature, changements bien prepares
Haute 5-10 % Processus solide avec quelques lacunes
Moyenne 10-15 % Des améliorations processus sont nécessaires
Faible > 15 % Process insuffisant ou contourne fréquemment

Lead Time for Changes

Le lead time mesure le temps ecoule entre le premier commit d'un changement et son déploiement en production.

Performance Lead Time Interpretation
Elite < 1 heure Déploiement continu, pipeline très automatise
Haute 1 jour - 1 semaine CI/CD mature, process lean
Moyenne 1 semaine - 1 mois Processus manuel significant
Faible > 1 mois Cycles de release longs, friction importante

Métriques vanity vs métriques actionnables

Le nombre de tickets de change créés, le taux d'approbation du CAB, la durée moyenne des fenêtres de maintenance — ces métriques sont faciles a produire et impressionnantes dans un reporting, mais elles mesurent l'activité du process, pas sa valeur. Les métriques DORA mesurent l'impact sur la production : est-ce que les changements causent des incidents ? Est-ce qu'ils arrivent en production rapidement ? Ce sont ces questions qui importent.


Post-Implémentation Review (PIR)

La Post-Implémentation Review est une analyse structurée effectuee après un changement significatif — réussi ou ayant nécessité un rollback. Elle n'est pas un debriefing de blame mais une opportunité d'apprentissage.

Quand faire une PIR

Situation PIR obligatoire
Changement ayant cause un incident Oui
Rollback exécuté Oui
Dépassement significatif de la fenêtre prévue Recommande
Changement majeur réussi (migration datacenter, etc.) Recommande
Changement standard nominal Non

Template de PIR

Section Contenu
Contexte Description du changement, date, équipe, périmètre
Déroulement Ce qui s'est passe, ecarts par rapport au plan
Impact Utilisateurs, services, données affectes (si incident)
Causes Ce qui a permis (ou cause) ce résultat
Actions Actions correctives identifiées, responsable, deadline
Métriques Durée réelle vs estimée, services impactes, incidents générés

La PIR doit être terminee dans les 72 heures qui suivent le changement. Au-delà, les détails sont perdus et les actions ne sont pas prises.


Tableau de bord change management

Un tableau de bord centralise donne une vision continue de la sante du processus. Il doit être consulte au moins hebdomadairement par le Change Manager.

Métrique Fréquence Alarme si
Change Failure Rate Hebdomadaire > 10 % sur 4 semaines glissantes
Changements sans RFC Hebdomadaire > 0 (shadow changes)
Fenêtres depassees Par changement Dépassement > 25 % de la durée prévue
Rollbacks exécutés Par changement Tout rollback = PIR obligatoire
Lead time moyen Mensuel Tendance à la hausse
PIR en retard Hebdomadaire Toute PIR > 72h après le changement

Boucle d'amélioration PDCA

Le change management n'est pas un processus statique — il s'amélioré en continu via le cycle PDCA (Plan-Do-Check-Act).

graph LR
    A["PLAN<br/>Definir le process,<br/>les criteres et les KPIs"] --> B["DO<br/>Executer les changements<br/>selon le process"]
    B --> C["CHECK<br/>Mesurer CFR, lead time,<br/>PIR, incidents causes"]
    C --> D["ACT<br/>Identifier les ecarts,<br/>ajuster le process"]
    D --> A

Applications concrètes

Observation Action PDCA
CFR > 15 % plusieurs semaines Analyser les PIR : cause commune ? Manque de tests ? Rollback mal préparé ?
Lead time en hausse Le CAB est-il un goulot ? Les approbations peuvent-elles être simplifiées ?
Shadow changes fréquents Le process est trop lent ou trop complexe — le simplifier pour les changements standards
Rollbacks systematiques sur un type de changement Ce type doit-il passer en changement normal avec procédure renforcee ?

Intégration aux métriques SRE

Le change management s'intégré aux pratiques SRE via les error budgets. Un change failure rate élevé consomme du budget d'erreur — ce qui peut déclencher un gel automatique des changements non critiques jusqu'à ce que le budget soit reconstitue.

Cette intégration permet de lier la gouvernance du change à la réalité opérationnelle : ce n'est plus "le process dit non" mais "notre budget d'erreur ne permet pas ce risque supplémentaire".


Outils

Outil Description Lien
DORA DevOps Quick Check Auto-évaluation des métriques DORA dora.dev
Grafana Tableaux de bord avec datasources multiples grafana.com
Four Keys (Google) Implémentation open source des métriques DORA github.com/dora-team/fourkeys
Sleuth DORA metrics automatiques depuis le pipeline sleuth.io