Méthode d'exploitation¶
Pratiques opérationnelles pour gérer une infrastructure en production : gestion des changements et incidents, automatisation, supervision, capacité, documentation, sécurité et collaboration. Chaque tutoriel suit une progression du fondamental aux cas avances.
Contenu¶
| Section | Description |
|---|---|
| Gérer les changements | Processus, fenêtres de maintenance, exécution, rollback et automatisation |
| Gérer les incidents | Détection, escalade, réponse, résolution et post-mortem |
| Automatiser l'infrastructure | Provisioning, configuration management, drift détection et testing |
| Superviser et alerter | SLO/SLI/SLA, alerting, dashboards, logs et traces |
| Planifier la capacité | Baselines, dimensionnement, prévisions, scaling et FinOps |
| Documenter l'exploitation | Runbooks, architecture, procédures, wiki et automatisation |
| Securiser l'infrastructure | Hardening, secrets, patching, conformité et sécurité réseau |
| Collaborer en exploitation | On-call, blameless culture, toil management, communication et SRE |