Aller au contenu

Fondamentaux du change management

Comprendre pourquoi les changements non contrôles provoquent des incidents — et comment une taxonomie claire réduit le risque.


Pourquoi le change management

Les changements sont la première cause d'incidents en production. Les études ITIL et les postmortems de grands opérateurs convergent : 70 a 80 % des incidents sont causes par un changement — déploiement, reconfiguration, mise à jour de dépendance, modification réseau.

Sans process de changement :

  • un déploiement effectue un vendredi soir sans backup provoquer une panne le week-end
  • une mise à jour de librairie casse silencieusement une API consommee par dix équipes
  • un changement de configuration effectue "juste pour tester" reste en production indéfiniment

Le change management ne ralentit pas les équipes — il réduit le temps perdû à gérer les incidents causes par des changements non contrôles.

Le coût réel d'un incident non maîtrise

Conséquence Impact concret
Panne de service Perte de chiffre d'affaires, SLA pénalités
Escalade Astreintes, mobilisation des équipes en dehors des heures
Confiance client Churn, image de marque dégradée
Technique Dette de correction, instabilite residuelle

Taxonomie des changements

ITIL v4 distingue trois types de changements. Chaque type a un workflow adapté a son niveau de risque.

Type Définition Exemples ops Workflow
Standard Changement pre-approuve, à faible risque, procédure documentee Renouvellement de certificat, ajout d'un utilisateur, rotation de clé Exécution directe, enregistrement post-facto
Normal Changement planifie, évalué et approuve avant exécution Migration de base de données, montee de version majeure, refonte réseau Demande → évaluation → CAB → planification → exécution
Urgent Changement nécessaire immédiatement pour restaurer un service Rollback d'urgence, correctif de sécurité critique (0-day), coupure réseau Procès accéléré, approbation réduite, retroactive si nécessaire

Critères de classification

La bonne question a se poser pour classer un changement :

  • Fréquence : ce changement a-t-il déjà été exécuté avec succès plusieurs fois ?
  • Impact : combien de services, d'utilisateurs ou de données sont affectes ?
  • Réversibilité : peut-on revenir en arriere facilement en moins de 15 minutes ?
  • Procédure : existe-t-il une runbook validee et testée pour ce changement ?

Un changement standard répond OUI aux quatre critères. Un changement normal répond NON a au moins un. Un changement urgent s'impose par les circonstances.


ITIL v4 simplifie — Change Enablement

ITIL v4 remplacé l'ancien "Change Management" par la pratique Change Enablement, centree sur la valeur et la vitesse plutôt que sur la conformité formelle.

graph TD
    A["Demande de changement<br/>(RFC)"] --> B["Evaluation du risque<br/>et de l'impact"]
    B --> C{Type}
    C -->|Standard| D["Execution directe<br/>+ enregistrement"]
    C -->|Normal| E["CAB / Peer review<br/>+ planification"]
    C -->|Urgent| F["Approbation acceleree<br/>(ECAB ou manager)"]
    E --> G["Execution planifiee"]
    F --> G
    G --> H["Verification<br/>post-changement"]
    H --> I["Cloture<br/>+ PIR si necessaire"]

Ce que ITIL v4 change par rapport à ITIL v3

ITIL v3 privilegiait le contrôle strict via le CAB. ITIL v4 reconnait que des changements standard bien définis n'ont pas besoin de passer par un comite — cela crée de la friction sans valeur ajoutee. Le CAB reste pertinent pour les changements a fort impact, mais doit être un accelerateur et non un point de blocage.


Change vs Release vs Deploy

Ces trois termes sont souvent confondus. Leur distinction est fondamentale pour structurer un process clair.

Concept Définition Exemple
Change Tout ajout, modification ou suppression pouvant affecter les services IT Modifier la configuration d'un pare-feu
Release Ensemble de changements regroupes, testés et valides pour mise en production Version 2.4.0 d'une application
Deploy Acte technique de livraison d'une release dans un environnement kubectl apply -f deployment.yaml

Un deploy peut contenir plusieurs releases, chacune regroupant plusieurs changes. Comprendre cette hiérarchie permet de savoir à quel niveau appliquer la gouvernance.


Shadow changes

Les shadow changes — le risque invisible

Un shadow change est une modification effectuee en production sans passer par le process de changement. Raisons courantes : urgence percue, contournement d'un process juge trop lent, manque de formation.

Les shadow changes sont dangereux parce que :

  • ils ne sont pas documentes → impossible de les identifier lors d'un postmortem
  • ils ne sont pas testés → risque de régression non détecté
  • ils créent une dérivé de configuration entre ce qui est documente et ce qui tourne reellement

La solution n'est pas de durcir le process mais de le rendre assez rapide pour être suivi même en urgence.


Outils

Outil Description Lien
ServiceNow Plateforme ITSM référence pour le change management en entreprise servicenow.com
Jira Service Management Gestion des changements intégrée à l'écosystème Atlassian atlassian.com/jira/service-management
GitLab Issues Ticketing léger intégré au VCS, adapté aux équipes DevOps gitlab.com
Gitea Alternative self-hosted légère avec issues et milestones gitea.io