Observabilité¶
Services de monitoring, logging et tracing sur Amazon Web Services.
CloudWatch¶
Service central de monitoring et d'observabilité AWS. CloudWatch collecte les métriques, les logs et les traces des services AWS et de vos applications.
Cas d'usage : alertes sur CPU/mémoire/disque des instances, dashboards de performance, analyse de logs, métriques custom applicatives.
Métriques et alarmes¶
CloudWatch collecte automatiquement les métriques des services AWS (EC2, RDS, Lambda, etc.). Vous pouvez créer des alarmes pour reagir aux seuils depasses.
aws cloudwatch put-metric-alarm \
--alarm-name cpu-haute \
--metric-name CPUUtilization \
--namespace AWS/EC2 \
--statistic Average \
--period 300 \
--threshold 80 \
--comparison-operator GreaterThanThreshold \
--evaluation-periods 2 \
--alarm-actions arn:aws:sns:eu-west-3:123456789012:mes-alertes \
--dimensions Name=InstanceId,Value=i-0123456789abcdef0
Logs¶
CloudWatch Logs centralise les logs de vos services et applications. Les logs sont organises en log groups et log streams.
Fonctionnalités clés :
- Ingestion depuis EC2 (agent CloudWatch), Lambda, ECS, etc.
- CloudWatch Logs Insights pour requeter les logs en SQL-like
- Metric filters pour créer des métriques à partir de patterns de logs
- Export vers S3 pour archivage long terme
Dashboards¶
Tableaux de bord personnalisables combinant métriques, logs et alarmes dans une vue unifiee.
Métriques custom
Envoyez vos propres métriques applicatives avec put-metric-data pour monitorer des KPI métier au même endroit que les métriques infrastructure.
X-Ray¶
Tracing distribué pour analyser la latence des requêtes à travers les services. X-Ray trace les appels entre Lambda, ECS, EC2, API Gateway, DynamoDB et d'autres services AWS.
Cas d'usage : identification des goulets d'étranglement, analyse de latence dans les architectures microservices, correlation entre services, détection d'erreurs en cascade.
Fonctionnalités clés :
- Service map visuelle des dépendances
- Traces détaillées par requête
- Annotations et metadata custom
- Intégration native avec Lambda et API Gateway
CloudTrail¶
Journal d'audit de tous les appels API effectues dans votre compte AWS. CloudTrail enregistre qui a fait quoi, quand et depuis ou.
Cas d'usage : audit de sécurité, conformité reglementaire, investigation d'incidents, détection d'activité suspecte.
aws cloudtrail lookup-events \
--lookup-attributes AttributeKey=EventName,AttributeValue=RunInstances \
--max-results 5
CloudTrail vs CloudWatch Logs
CloudTrail enregistre les appels API AWS (plan de contrôle). CloudWatch Logs collecte les logs applicatifs et système (plan de données). Les deux sont complementaires.