Service : Observabilité¶

Stack de monitoring complète : collecte de métriques, alerting et visualisation.

Vue d'ensemble¶

Produit	Description	Statut
Prometheus	Collecte et stockage de métriques	A venir
Grafana	Dashboards et visualisation	A venir
Alertmanager	Alertes email, Slack, webhook	A venir
Exporters	node_exporter, cAdvisor — métriques système et conteneurs	A venir

graph LR
    A["Exporters"] --> B["Prometheus"]
    B --> C["Alertmanager"]
    B --> D["Grafana"]
    D --> E["Dashboards"]

Composant	Rôle dans le service	Référence
Système	Serveurs Prometheus, Grafana	Système
Réseau	Endpoints de scraping, accès dashboards	Réseau
Stockage	Rétention des métriques	Stockage

Déploiement des composants via IaC. Chaque produit est deployable independamment.

Rôle	Périmètre	Permissions
Administrateur	Stack complète	Déployer, configurer les data sources et les règles
Opérateur	Alerting	Gérer les alertes, silences et escalades
Utilisateur	Dashboards	Consulter les dashboards et métriques

Installation de la stack Prometheus + Grafana + Alertmanager.

Maintenance des targets de scraping, mise à jour des dashboards, gestion de la rétention.

Sauvegarde des configurations Grafana (dashboards, datasources) et des règles Prometheus. Métriques re-collectables après redémarrage.

Arrêt des composants, export des dashboards, suppression des données.

A venir

Ce service est en cours de construction.