Aller au contenu

Observabilité

Services de monitoring, logging et tracing sur Amazon Web Services.


CloudWatch

Service central de monitoring et d'observabilité AWS. CloudWatch collecte les métriques, les logs et les traces des services AWS et de vos applications.

Cas d'usage : alertes sur CPU/mémoire/disque des instances, dashboards de performance, analyse de logs, métriques custom applicatives.

Métriques et alarmes

CloudWatch collecte automatiquement les métriques des services AWS (EC2, RDS, Lambda, etc.). Vous pouvez créer des alarmes pour reagir aux seuils depasses.

aws cloudwatch put-metric-alarm \
    --alarm-name cpu-haute \
    --metric-name CPUUtilization \
    --namespace AWS/EC2 \
    --statistic Average \
    --period 300 \
    --threshold 80 \
    --comparison-operator GreaterThanThreshold \
    --evaluation-periods 2 \
    --alarm-actions arn:aws:sns:eu-west-3:123456789012:mes-alertes \
    --dimensions Name=InstanceId,Value=i-0123456789abcdef0

Logs

CloudWatch Logs centralise les logs de vos services et applications. Les logs sont organises en log groups et log streams.

Fonctionnalités clés :

  • Ingestion depuis EC2 (agent CloudWatch), Lambda, ECS, etc.
  • CloudWatch Logs Insights pour requeter les logs en SQL-like
  • Metric filters pour créer des métriques à partir de patterns de logs
  • Export vers S3 pour archivage long terme

Dashboards

Tableaux de bord personnalisables combinant métriques, logs et alarmes dans une vue unifiee.

Métriques custom

Envoyez vos propres métriques applicatives avec put-metric-data pour monitorer des KPI métier au même endroit que les métriques infrastructure.

X-Ray

Tracing distribué pour analyser la latence des requêtes à travers les services. X-Ray trace les appels entre Lambda, ECS, EC2, API Gateway, DynamoDB et d'autres services AWS.

Cas d'usage : identification des goulets d'étranglement, analyse de latence dans les architectures microservices, correlation entre services, détection d'erreurs en cascade.

Fonctionnalités clés :

  • Service map visuelle des dépendances
  • Traces détaillées par requête
  • Annotations et metadata custom
  • Intégration native avec Lambda et API Gateway

CloudTrail

Journal d'audit de tous les appels API effectues dans votre compte AWS. CloudTrail enregistre qui a fait quoi, quand et depuis ou.

Cas d'usage : audit de sécurité, conformité reglementaire, investigation d'incidents, détection d'activité suspecte.

aws cloudtrail lookup-events \
    --lookup-attributes AttributeKey=EventName,AttributeValue=RunInstances \
    --max-results 5

CloudTrail vs CloudWatch Logs

CloudTrail enregistre les appels API AWS (plan de contrôle). CloudWatch Logs collecte les logs applicatifs et système (plan de données). Les deux sont complementaires.