Alerting sorgt dafür, dass kritische Zustände nicht nur gemessen, sondern auch gemeldet werden. Es ist ein wichtiger Teil des Betriebs von Servern, Diensten und Anwendungen.
1 Auslöser
Alerts können durch unterschiedliche Ereignisse entstehen.
- Dienst nicht erreichbar.
- CPU-, RAM- oder Festplattenwerte überschreiten Schwellwerte.
- TLS-Zertifikat läuft bald ab.
- Backups schlagen fehl.
2 Qualität von Alerts
Nicht jeder Messwert sollte sofort eine Warnung auslösen. Gute Alerts sind handlungsorientiert.
- Klare Prioritäten definieren.
- Warnungen mit konkreten Ursachen versehen.
- Alarmmüdigkeit durch zu viele Meldungen vermeiden.
3 Eskalation
Bei wichtigen Systemen sollte klar sein, wer wann reagiert.
- Kontaktwege festlegen.
- Bereitschaften oder Zuständigkeiten dokumentieren.
- Wiederkehrende Alerts dauerhaft beheben.
4 Fazit
Alerting macht Monitoring erst betrieblich wirksam. Entscheidend sind sinnvolle Schwellwerte, klare Zuständigkeiten und möglichst wenige unnötige Meldungen.