Warum SIGNL4
Wenn kritische Systeme ausfallen, ist SIGNL4 der schnellste Weg, eure Mitarbeiter, Ingenieure, IT-Administratoren in Bereitschaft zu alarmieren, egal, wo sich diese befinden. SIGNL4 bietet zuverlässige Benachrichtigungen per App-Push, SMS und Sprachanruf mit Nachverfolgung, Eskalationen und Dienst-Planung.
Prometheus ist ein Open-Source-Monitoring-Tool, das Verfügbarkeit und Leistung überwacht. Es bietet euch einen einfachen Zugriff auf relevante Daten, zum Beispiel auch im Zusammenspiel mit Grafana. SIGNL4 ermöglicht es Prometheus auf einfache Art und Weise, mobile Teams vor Ort oder in Bereitschaft in Echtzeit zu benachrichtigen. Dies beschleunigt eure Reaktion erheblich und setzt Ressourcen in den Einsätzen frei.
Durch die Integration von Prometheus mit SIGNL4 könnt ihr eure täglichen Abläufe verbessern, indem eure Teams in kritischen Situationen informiert werden, wo auch immer es sich befindet.
So funktioniert es
SIGNL4 alarmiert Teams und Rufbereitschaften auf ihren mobilen Endgeräten, wenn IT-Störungen von Prometheus erkannt werden. Persistente Benachrichtigungen, Bestätigungen und Eskalationen stellen sicher, dass die Probleme behandelt werden, bevor es zu spät ist.
Integrations-Fähigkeiten
Szenarien
Vorfälle und Alarme werden von Prometheus Alertmanager an SIGNL4 gesendet
Sichere Übermittelung, Kategorisierung und zielgenaues Routing
Mobile, persistente Alarmierung von Bereitschafts- und Diensthabenden per Push, SMS und Anruf mit Nachverfolgung und Eskalation
UND SO FUNKTIONIERT ES
Die Integration von Prometheus und SIGNL4 wird über den Alertmanager realisiert, der Teil von Prometheus ist.
Voraussetzungen
Ein SIGNL4 (https://www.signl4.com) Konto
Eine Prometheus-Installation (https://prometheus.io)
Eine Alertmanager-Installation (https://prometheus.io/docs/prometheus/latest/configuration/alerting_rules/)
Die Integration wird über den Standard Webhook im Alertmanager realisiert. Weitere Informationen hierzu gibt es hier:
https://prometheus.io/docs/alerting/latest/configuration/#webhook_config
Eine Beispiel-Konfiguration könnte, wie folgt aussehen:
global:
resolve_timeout: 5m
receivers:
- name: prometheus-signl4
webhook_configs:
- url: https://connect.signl4.com/webhook/
send_resolved: true
route:
group_by:
- job
group_interval: 5m
group_wait: 30s
receiver: prometheus-signl4
repeat_interval: 2m
routes:
- match:
alertname: Watchdog
receiver: prometheus-signl4
Du musst hier noch durch dein SIGNL4-Team-Secret ersetzen.
Geschlossene Alarme
Um Alarme in SIGNL4 wieder zu schließen, wenn diese in Prometheus geschlossen werden, kannst du diese SIGNL4 URL verwenden.
https://connect.signl4.com/webhook/?ExtIDParam=groupKey&ExtStatusParam=status&ResolvedStatus=resolved
Weitere Informationen hierzu findest du hier:
https://www.signl4.com/de/update-juli-2020-alarme-schliessen/
Teste es
Das ist alles und nun kannst du die Alarmierung testen. Du kannst hierzu einen Alarm in Prometheus simulieren und du solltest dann eine Alarmierung in deiner SIGNL4 App erhalten.
ALARM-OPTIMIERUNG
SIGNL4 kann die Wahrnehmung, Reaktion und Bearbeitung von kritischen Alarmen entscheidend verbessern. Durch die Anpassung von Farbe, Symbol und Push-Ton wird die Zuordnung und Relevanz von Alarmen deutlich beschleunigt.
Alarmfarbe ändern, Titel + Text überschreiben
Dazu musst du entsprechend „Dienste und Systeme“-Kategorien erstellen, die auf bestimmte Schlüsselwörter ansprechen. Gehe dazu in der mobilen App in die Einstellungen und wähle „Dienste und Systeme“. Erstelle eine neue Kategorie oder bearbeite einfach eine bestehende.
Eine Kategorie wird immer angewendet, wenn einzelne Schlüsselwörter oder Kombinationen von Schlüsselwörtern im auslösenden Event gefunden werden.