Blameless culture¶
Sécurité psychologique, just culture et apprentissage systematique à partir des incidents.
Sécurité psychologique¶
La sécurité psychologique (Amy Edmondson, Harvard Business School) désigne la conviction partagee qu'on peut prendre des risques interpersonnels sans être puni ni ridiculise. C'est le facteur numéro un de performance des équipes selon les études de Google (Project Aristotle).
Pourquoi c'est fondamental en ops¶
En exploitation, les personnes doivent pouvoir :
- Signaler une anomalie sans craindre d'être blame pour l'avoir créée
- Admettre qu'elles ne savent pas comment résoudre un incident
- Proposer des hypothèses incorrectes pendant un diagnostic
- Escalader rapidement sans honte lorsque la situation dépassé leur expertise
Sans sécurité psychologique, les informations critiques arrivent trop tard ou pas du tout, aggravant les incidents.
Just culture : ni blame ni laisser-faire¶
La just culture est un modèle issu de l'aviation et de la medicine qui cherche l'équilibre entre responsabilité individuelle et facteurs systemiques.
Les trois approches face à l'erreur¶
| Approche | Principe | Conséquence |
|---|---|---|
| Culture du blame | L'individu est responsable | Dissimulation, peur, répétition des erreurs |
| Laisser-faire | Personne n'est responsable | Absence d'apprentissage, erreurs ignorees |
| Just culture | Le système est responsable, l'individu contribue | Apprentissage, amélioration continue |
Focus systèmes¶
Dans une blameless culture, la question n'est pas "qui a fait l'erreur ?" mais :
- Quelles conditions ont rendu l'erreur possible ou probable ?
- Quels garde-fous auraient pu prévenir ou limiter l'impact ?
- Comment modifier le système pour qu'un autre humain ne fasse pas la même erreur ?
Blameless ne signifie pas sans conséquences
Blameless ne veut pas dire que tout comportement est acceptable. La conséquence d'une erreur dans une blameless culture est l'amélioration du système, pas la punition individuelle — sauf negligence grave intentionnelle, qui releve des RH, pas de la culture ops.
Learning from failure¶
Chaque incident est une opportunité d'apprentissage. Cette vision n'est pas naive : elle est économique. Un incident "gratuit" (sans apprentissage) coûteux en downtime est un gachis double.
Lien avec les post-mortems¶
Le postmortem blameless est l'outil principal de capitalisation sur les incidents. Il documente :
- Le timeline factuel de l'incident
- Les facteurs contribuants (systemiques, pas individuels)
- Les actions correctives avec propriétaires et dates
Voir Gérer les incidents pour le format détaillé des post-mortems.
La spirale vertueuse¶
graph LR
A["Incident"] --> B["Postmortem blameless"]
B --> C["Actions correctives"]
C --> D["Systeme plus robuste"]
D --> E["Moins d'incidents"]
E --> F["Confiance equipe"]
F --> G["Signalement plus rapide"]
G --> A Pratiques concrètes¶
Langage a adopter¶
| Au lieu de... | Dire plutôt... |
|---|---|
| "Qui a fait ca ?" | "Qu'est-ce qui a permis que ca arrive ?" |
| "C'est de ta faute" | "Qu'est-ce qu'on aurait pu faire differemment ?" |
| "Tu aurais du savoir" | "Comment aurait-on pu rendre ca plus évident ?" |
| "Encore une erreur humaine" | "Quelle automatisation aurait prevenu ca ?" |
Rétrospectives d'équipe¶
- Fréquence : mensuelle ou après chaque incident significatif
- Format : 4L (Liked, Learned, Lacked, Longed For) ou simple QQOQCP
- Règles : bienveillance, spécificité, action concrète pour chaque point retenu
- Suivi : les actions des retros précédentes sont relues en début de seance
Partage des erreurs¶
Créer des rituels de partage des erreurs normalise l'échec :
- "Incident de la semaine" en weekly team : 5 min, ton neutre, apprentissage
- Canal Slack dédié aux "near misses" sans conséquences
- Partage inter-équipes (guildes ops, community of practice)
La blameless culture se construit de haut en bas
Si le management blame publiquement en cas d'incident, aucune pratique d'équipe ne compensera. Le sponsor de la blameless culture doit être visible aux niveaux managerial et directorial.