Observer¶
L'observabilité est la capacité a comprendre l'état interne d'un système à partir de ses sorties externes. Elle va au-delà du simple monitoring en permettant de repondre a des questions imprevues sur le comportement des services.
Les 3 piliers de l'observabilité¶
| Pilier | Question | Outils |
|---|---|---|
| Metriques | Que se passe-t-il en ce moment ? | Prometheus, Mimir, VictoriaMetrics |
| Logs | Pourquoi cela s'est-il produit ? | Loki, Elasticsearch, Alloy |
| Traces | Quel chemin a suivi cette requête ? | Tempo, Jaeger, OpenTelemetry |
graph TD
Metrics["Metriques<br/>Compteurs, Jauges,<br/>Histogrammes"] --> Grafana["Grafana<br/>(correler)"]
Logs["Logs<br/>Evenements structures<br/>(JSON)"] --> Grafana
Traces["Traces<br/>Spans distribues<br/>(contexte)"] --> Grafana Classification¶
| Aspect | Niveau |
|---|---|
| Données manipulees | Confidentiel (metriques et logs peuvent contenir des données sensibles) |
| Zone de déploiement | Production |
| Chiffrement | TLS obligatoire, stockage chiffre at-rest |
Données sensibles dans les logs
Les logs applicatifs et les metriques a haute cardinalite peuvent contenir des PII (identifiants utilisateur, adresses IP, tokens). Le filtrage et le RBAC sont obligatoires — voir le chapitre Confidentialite.
Chapitres¶
| Chapitre | Sujet |
|---|---|
| Fondamentaux | Monitoring vs observabilité, méthodes USE/RED, SLI/SLO/SLA, OpenTelemetry |
| Comparaison des solutions | LGTM vs Datadog vs ELK vs VictoriaMetrics — grille ADR |
| Architecture de référence | Stack LGTM, backends de stockage, dimensionnement |
| Installation et configuration | Déploiement LGTM sur Podman/K8s, configuration Prometheus, Loki, Grafana |
| Integration | Instrumentation des services du catalogue, dashboards par service |
| Confidentialite | Filtrage PII, RBAC Grafana, chiffrement, retention differenciee |
| Bonnes pratiques | HA, alerting, design de dashboards, maîtrise des coûts, troubleshooting |