prometheus

Mobile Alarmierung per App, SMS und Anruf für Prometheus Alertmanager

Prometheus_SIGNL4_Alert

Warum SIGNL4

Wenn kritische Systeme ausfallen, ist SIGNL4 der schnellste Weg, eure Mitarbeiter, Ingenieure, IT-Administratoren in Bereitschaft zu alarmieren, egal, wo sich diese befinden. SIGNL4 bietet zuverlässige Benachrichtigungen per App-Push, SMS und Sprachanruf mit Nachverfolgung, Eskalationen und Dienst-Planung.

Prometheus ist ein Open-Source-Monitoring-Tool, das Verfügbarkeit und Leistung überwacht. Es bietet euch einen einfachen Zugriff auf relevante Daten, zum Beispiel auch im Zusammenspiel mit Grafana. SIGNL4 ermöglicht es Prometheus auf einfache Art und Weise, mobile Teams vor Ort oder in Bereitschaft in Echtzeit zu benachrichtigen. Dies beschleunigt eure Reaktion erheblich und setzt Ressourcen in den Einsätzen frei.

Durch die Integration von Prometheus mit SIGNL4 könnt ihr eure täglichen Abläufe verbessern, indem eure Teams in kritischen Situationen informiert werden, wo auch immer es sich befindet.

So funktioniert es

SIGNL4 alarmiert Teams und Rufbereitschaften auf ihren mobilen Endgeräten, wenn IT-Störungen von Prometheus erkannt werden. Persistente Benachrichtigungen, Bestätigungen und Eskalationen stellen sicher, dass die Probleme behandelt werden, bevor es zu spät ist.

Integrations-Fähigkeiten

  • IT-Mitarbeiter werden per mobilem Push, SMS und Anruf benachrichtigt
  • Mitarbeiter können kritische Alarme bestätigen und übernehmen
  • Alarme werden eskaliert, wenn keine Antwort erfolgt
  • Mobiler Chat erlaubt den Austausch mit Kollegen in Echtzeit über die Störungsbeseitigung
  • Prometheus Alertmanager sendet Event-Daten per Webhook an SIGNL4

 Szenarien

  • Systemüberwachung
  • Applikationsüberwachung
  • Netzwerk-Überwachung
  • Datenbank-Monitoring
FS_neu_2

Vorfälle und Alarme werden von Prometheus Alertmanager an SIGNL4 gesendet

Sichere Übermittelung, Kategorisierung und zielgenaues Routing

Mobile, persistente Alarmierung von Bereitschafts- und Diensthabenden per Push, SMS und Anruf mit Nachverfolgung und Eskalation

UND SO FUNKTIONIERT ES

Die Integration von Prometheus und SIGNL4 wird über den Alertmanager realisiert, der Teil von Prometheus ist.

Voraussetzungen

Ein SIGNL4 (https://www.signl4.com) Konto

Eine Prometheus-Installation (https://prometheus.io)

Eine Alertmanager-Installation (https://prometheus.io/docs/prometheus/latest/configuration/alerting_rules/)

Die Integration wird über den Standard Webhook im Alertmanager realisiert. Weitere Informationen hierzu gibt es hier:

https://prometheus.io/docs/alerting/latest/configuration/#webhook_config

Eine Beispiel-Konfiguration könnte, wie folgt aussehen:

global:
  resolve_timeout: 5m
receivers:
- name: prometheus-signl4
  webhook_configs:
  - url: https://connect.signl4.com/webhook/
    send_resolved: true
route:
  group_by:
  - job
  group_interval: 5m
  group_wait: 30s
  receiver: prometheus-signl4
  repeat_interval: 2m
  routes:
  - match:
      alertname: Watchdog
    receiver: prometheus-signl4

Du musst hier noch durch dein SIGNL4-Team-Secret ersetzen.

Geschlossene Alarme

Um Alarme in SIGNL4 wieder zu schließen, wenn diese in Prometheus geschlossen werden, kannst du diese SIGNL4 URL verwenden.

https://connect.signl4.com/webhook/{teamSecret}?ExtIDParam=groupKey&ExtStatusParam=status&ResolvedStatus=resolved

Weitere Informationen hierzu findest du hier:

https://www.signl4.com/de/update-juli-2020-alarme-schliessen/

Teste es

Das ist alles und nun kannst du die Alarmierung testen. Du kannst hierzu einen Alarm in Prometheus simulieren und du solltest dann eine Alarmierung in deiner SIGNL4 App erhalten.

ALARM-OPTIMIERUNG
SIGNL4 kann die Wahrnehmung, Reaktion und Bearbeitung von kritischen Alarmen entscheidend verbessern. Durch die Anpassung von Farbe, Symbol und Push-Ton  wird die Zuordnung und Relevanz von Alarmen deutlich beschleunigt.

alertoptimization

Alarmfarbe ändern, Titel + Text überschreiben

Dazu musst du entsprechend „Dienste und Systeme“-Kategorien erstellen, die auf bestimmte Schlüsselwörter ansprechen. Gehe dazu in der mobilen App in die Einstellungen und wähle „Dienste und Systeme“. Erstelle eine neue Kategorie oder bearbeite einfach eine bestehende.

Eine Kategorie wird immer angewendet, wenn einzelne Schlüsselwörter oder Kombinationen von Schlüsselwörtern im auslösenden Event gefunden werden.

Ähnliche Integrationen

Acure

IT-Betrieb

Albato

IT-Betrieb

Alertra

IT-Betrieb

Amazon Alexa

Industry 4.0 / IT-Betrieb

AppOptics

IT-Betrieb

AppDynamics

IT-Betrieb

Apify

IT-Betrieb

Atatus

IT-Betrieb

Atera

IT-Betrieb

Autocode (Standard Library)

IT-Betrieb

Autotask

IT-Betrieb

AWS CloudWatch

IT-Betrieb

BigPanda

IT-Betrieb

BMC Helix

IT-Betrieb

Centreon

IT-Betrieb

Checkly

IT-Betrieb

Checkmk

IT-Betrieb

CloudMonix von Netreo

IT-Betrieb

CloudStats

IT-Betrieb

ConnectWise

IT-Betrieb

Datadog

IT-Betrieb

Dynatrace

IT-Betrieb

elastic.io

IoT / IT-Betrieb

EventSentry

IT-Betrieb