Observabilité¶
Services de monitoring, logging et tracing sur Google Cloud Platform.
Cloud Monitoring¶
Surveillance des métriques d'infrastructure et d'application. Cloud Monitoring collecte automatiquement les métriques des services GCP et permet de créer des dashboards et des alertes.
Cas d'usage : alertes sur CPU/mémoire/disque des VMs, dashboards de performance, SLO/SLI tracking, métriques custom applicatives.
Fonctionnalités clés :
- Métriques automatiques pour tous les services GCP
- Alerting policies avec notifications (email, Slack, PagerDuty, webhooks)
- Uptime checks (HTTP, TCP, HTTPS)
- Dashboards personnalisables
Cloud Logging¶
Collecte et analyse centralisee des logs. Cloud Logging ingere automatiquement les logs des services GCP et permet le filtrage, l'export et l'archivage.
Cas d'usage : debug applicatif, audit de sécurité, conformité, analyse post-incident.
Fonctionnalités clés :
- Ingestion automatique des logs GCP (Compute Engine, GKE, Cloud Run, etc.)
- Langage de requête pour filtrer et rechercher
- Export vers Cloud Storage, BigQuery ou Pub/Sub
- Log-based metrics pour créer des alertes sur des patterns de logs
Cloud Trace¶
Tracing distribué pour analyser la latence des requêtes à travers les services. Cloud Trace collecte les traces automatiquement pour App Engine et Cloud Run, et supporte l'instrumentation manuelle via OpenTelemetry.
Cas d'usage : identification des goulets d'étranglement, analyse de latence dans les architectures microservices, correlation entre services.
Error Reporting¶
Agrégation et notification des erreurs applicatives. Error Reporting regroupe les erreurs similaires, suit leur fréquence et envoie des alertes sur les nouvelles erreurs.
Cas d'usage : détection rapide de régressions, suivi des erreurs en production, priorisation des bugs par impact.