Wie SIGNL4 typische Probleme im Netzwerk-Monitoring löst

Aug 28, 2020 | IT-Betrieb

Ein neuer  Artikel in der Septemberausgabe von LANLine („Automatisierung schafft Produktivität“) fasst typische Herausforderungen und Probleme im Netzwerk-Monitoring sehr gut zusammen und lohnt sich wirklich zu lesen. Ich möchte hier ganz kurz auf einen Teil der angesprochenen Problemstellungen eingehen und wie unser Produkt SIGNL4 genau dafür als Lösung entwickelt wurde.

Problem 1: Zeitnahe Bearbeitung

Natürlich ist es wichtig, dass insbesondere kritische Alarme zeitnah bearbeitet werden. Auch aus kleinen Problemen können u.U. schnell größere Ausfälle resultieren. Email und Dashboards sind dabei oft Mittel der Wahl, da sie vom Monitoring-Werkzeug mitgebracht werden. Allerdings muss man sich der Limits dieser beiden Methoden bewußt sein und SIGNL4 kann hier Abhilfe schaffen:

  1. Ortsunbhängige und aufmerksamkeitsschonende Alarmierung: Dashboards erfordern die permante Aufmerksamkeit und/oder den entsprechenden Zugang, z.B. einen PC/Monitor. Die Bewegungsfreiheit der Mitarbeiter wird eingeschränkt. Die Alarmierung per Smartphone, Anruf und SMS durch SIGNL4 sorgt für höhere Flexbilität und Mobilität.
  2. Die Verwendung von Email zur Alarmierung hat mehrere Nachteile: Die Signalisierung ist oft wenig prägnant. Wichtige Alarme haben im Postfach die gleiche Stellung wie eine Amazon-Benachrichtigung. Die Nachverfolgung (Alarm quittiert, behoben oder nicht) ist schwer bis umständlich. Und die Zuständigkeit für einen Alarm (Übernahme durch einen Kollegen) ist ebenfalls schwierig. SIGNL4 schafft hier Abhilfe. Alarme werden quittiert und dies ist im ganzen Team in Echtzeit sichtbar. Die Signalisierung kann über Kategorien auf den Schweregrad und andere Parameter abgestimmt werden. Der Status eines Alarms ist direkt einsehbar.

Problem 2: Zuviele Alarme

Ein ganz großer Klassiker, der üblichweise dazu führt, dass wichtige Alarme, wenn es dann wirklich zählt, ignoriert, überlesen oder überhört werden. SIGNL4 bietet effektive Möglichkeiten einer Flut von verschiedenen Alarmen Herr zu werden:

  1. Alarme können gefiltert werden. Kategorien in SIGNL4 stellen quasi eine Whitelist dar, die auf einer Textsuche basiert. Werden Schlüsselwörter nicht erkannt, wird ein Alarm nicht übermittelt bzw. ausgelöst. Alternativ lässt sich auch eine Blacklist bauen, in der man alle „unerwünschte“ Schlüsselwörter in einer Alarmkategorie sammelt und dann die Sichtbarkeit dieser Kategorie abschaltet.
  2. Über die Kategorien kann SIGNL4 auch steuern ob und wie Alarme signalisiert werden. So können Alarme sichtbar sein aber es erfolgt keine Benachrichtigung per Push, SMS oder Anruf. Für bestimmte Alarmtypen kann darüber hinaus auch ein spezifischer Ton (und Farbe und Icon) festgelegt werden, so dass man schnell die Relevanz oder Kritikalität erkennen kann. Das hilft bei einer zielgenauen und schnellen Reaktion enorm.
  3. Kategorien können auch verwendet werden, um Alarme gemäß Zuständigkeiten und Fähigkeiten ausschließlich an bestimmte Teammitglieder zuzustellen (siehe Screenshot). Das verringert die Alarmlast bei den Kollegen.

Problem 3: Ungünstiger Zeitpunkt des Alarms

Viele wichtige Alarme treten selbstredend nicht tagsüber und während der normalen Arbeitszeiten auf. Wie nun sicher stellen, dass die Alarme trotzdem nicht übersehen werden ohne aber Mitarbeiter unnötig zu belasten? Der Versand an ein ganzes Team während der Nachtzeit ist hier kein sinnvoller Weg. Der Betrieb eines 24/7 NOC ist teuer und großen Unternehmen vorbehalten. Rufbereitschaften bieten sich an, brauchen aber ein Tool wie SIGNL4.

  1. SIGNL4 wurde genau für IT-Rufbereitschaften entwickelt. Die integrierte, sehr bequeme Planung der Dienstzeiten im Browser erlaubt ein automatisches Routing an den jeweiligen aktiven Rufbereitschaftshabenden (oder mehrere) ohne andere Mitarbeiter in Ihrer Freizeit zu belästigen.
  2. Alarmierung über mehrere Kanäle (Push, SMS und Anruf) sowie die wiederholte Signalisierung bis zur Quittierung sorgt für eine hohe Zuverlässigkeit bei der Reaktion auf einen wichtigen Alarm.
  3. Die Eskalationsfunktion von SIGNL4 stellt darüber hinaus sicher, dass Alarme doch noch ankommen, falls der Rufbereitschaftshabende die Benachrichtigungen verpasst hat.

Problem 4: Temporäre Alarme

Gerade im Netzwerkumfeld kommt es oft zu kurzzeitigen Ausfällen, die sich nach wenigen Sekunden wieder erübrigt haben. Solche Alarmen können viel Arbeit verursachen, denn es entsteht viel Aufwand, die Gültigkeit eines solchen Alarms nachzuverfolgen.

  1. SIGNL4 bietet dazu eine elegante Lösung. Das REST-API, die Email-Schnittstellen und auch fertige 2-Wege-Konnektoren (z.B. für Zabbix) bieten die Möglichkeit, dass Alarme aus dem auslösenden Monitoring-System in SIGNL4 geschlossen werden. D.h. also, dass wenn ein Alarm-Reset im Monitoring-System erfolgt, wird der Alarm auch in SIGNL4 auf geschlossen gesetzt und die Signaliserung wird gestoppt. Gleichzeitg bleibt der Alarm aber im Protokoll für spätere Analysten sichtbar.

Weitere Informationen

Hier ist eine Reihe von Videos (leider teilweise auf Englisch), die oben beschriebene Funktionen zeigen:

Alarmierung per SMS und Anruf

Eskalation

Dienstplanung mit SIGNL4

Rufbereitschaftsplanung mit einem Klick

Alarme über Kategorien routen

Integration mit Zabbix

Entdecke SIGNL4

SIGNL4 Alerting App

Mit SIGNL4 und seinen Superkräften bist du kritischen Ereignissen und Störungen immer einen Schritt voraus. SIGNL4 automatisiert Alarmierungsprozesse, liefert Alarme mobil und an die richtigen Personen zur richtigen Zeit und ermöglicht es Betriebsteams, von jedem Ort aus zu reagieren und kritische Störungen erfolgreich zu beheben.

Lerne mehr über SIGNL4 und starte Deinen 30-Tage-Test.