# Мониторинг Grafana крутится, алерты падают в чат (не в PagerDuty — мы не Amazon). ## На что смотрим | Метрика | Норм | Плохо | |---------|------|-------| | CPU | < 70% | > 90% | | Диск свободно | > 20% | < 10% | | Задержка | < 1.5s | > 3s | | 5xx | < 0.5% | > 2% | ## Health check ```bash curl https://mirror1.caelixflow.com/api/v1/health curl https://mirror2.caelixflow.com/api/v1/health ``` ## Логи - `/var/log/caelixflow/access.log` - `/var/log/caelixflow/error.log` Ротация раз в день, месяц храним. ## Если алерт пришёл 1. Глянуть Grafana 2. Написать в чат, что смотрим 3. Починить или отложить до завтра — по ситуации