Counter Flow

automated SLA Reporting

  • Import of data from monitor platforms or ticket systems
  • Calculation of the SLA overruns with variable methods
  • Consideration of the maintenance or non-operating hours
  • Presentation of the SLAs in dashboards
  • List of the main cause of SLA incidents
  • automated creation and dispatch of the finished reports

SLA metrics - aggregation

IT services consist of a large number of elements, components and technologies, which in turn are evaluated by different tools. However, a service and its quality must be described in a single number.
The SLA-relevant data is provided from many data sources and in different formats - and then often has to be aggregated manually in reporting - in order to make the final statement about the service quality.

SLIC can fully automate this process by recording the logic of the SLA once, setting up the interfaces to various tools, importing the data periodically, calculating incidents and calculating them in SLA metrics. SLIC takes into account operating times, maintenance windows and extraordinary malfunctions, which are calculated from the reports.

Availability & performance in the SLA report

Usually SLAs are related to availability and performance. These SLA metrics are often not provided by monitoring - they have to be generated by interpreting the raw data.

SLIC can import the raw data from monitoring systems and calculate the SLA metrics using its own data adapter. This raw data is evaluated in SLIC, compared against assigned threshold values and excesses are reported as incidents.

Service-oriented dashboards with clear workflows

After import and calculation, the data is displayed in dashboards:

• SLA time line / bar chart dashboard, presentation of the SLA metrics on a time axis - per service group or service

• SLA status dashboard, presentation of the services with the exact values of the incident time and the budget values up to the achievement of the SLA threshold for a month

SLA Dashboard

Performance and availability are shown for a selected period for services or service groups.
Different technologies can be represented together and correlated with one another.

Application Incident Heat Chart

This chart shows the nature of the incidents for each application or server in chronological order for a specific time.

Revision-capable service level reports

SLIC can import and correlate different data from different sources and generate multiple levels of visibility from this integration - such as

System / server from SNMP
• Application data from monitoring solutions such as Steelcentral® and
• Transaction data from synthetic click routes.

The generated reports are correctly formatted and available as PDF and HTML.
Comment functions within the reports and dashboards make it possible to comment on failures or deviations in the reports and make them visible.
Slic allows maintenance times, business hours and unscheduled off times to be taken into account.

Service Discovery

Applikations-Probleme werden i.d.R. zwischen den Service-Elementen weiter transportiert – ein Problem beim DB Server sorgt für schlechte Antwortzeiten beim Web-Server.
Die Kenntnis der Service Architektur ist die Voraussetzung für einer Service-Bewertung.

Exisitieren Kommunikations-Daten zwischen Servern im Backend, können diese in SLIC verwendet werden, um eine tägliche automatisierte Service Discovery durchzuführen.

Die Front-End- sowie Backend Server-Systeme werden aufgelistet bzw. in einem Architektur-Chart dargestellt.
Da die Service Discovery täglich durchgeführt wird, sind die Architektur Charts immer aktuell.
Änderungen innerhalb einer Service Kette, z.B. neue Server, werden erfasst und ausgewiesen.

Service Bewertung

Ist die Service Architektur erfasst, kann auch der Service bewertet werden, wenn relevante Daten vorliegen.
Abhängig von den vorliegenden Daten können Auswertungen vorgenommen werden.

Liege zB. für Web-Anwendungen Informationen vor wie Seiten-Lade-Zeiten, können Schwankungen oder Service-Level-Überschreitungen erkannt werden – und zusätzlich, ob im Backend ebenfalls Schwankungen vorlagen, die einen Zusammenhang erkennen lassen.

Für die Bewertung von Anwendungen wurde ein flexibles „Baseline“-Modul entwickelt, um Standard-Abweichungen festzustellen und diese für die Bewertung zu verwenden.

All-Data Import

Daten die aus Monitor-Systemen kommen, z.B. von synthetischen Software-Robotern, die Transaktionen testen, aus SNMP Monitoren, Capture Systemen oder System-Monitoring wie VmSphere können importiert, bewertet ebenfalls dargestellt werden.

SLIC Data Adapter errechnen aus den Roh-Daten die Werte für Verfügbarkeit und Performance und stellen diese in Reports bereit.

Capturing

Für die letzte Überprüfung von Incidents sowie der Analyse von Events, die keine Incidents erzeugt haben, müssen Packet-Daten analysiert werden.

In SLIC können High-Performance-Capture –Appliances (iPAC) integriert werden.
Der Workflow erlaubt es, direkt aus den Incident-Reports heraus Filter im BPF-Format zu erstellen und die Paket-Daten zu laden.

Die kostengünstigen „iPAC PacketStore“- Systeme capturen Pakete bis zu 40 Gbps dropless – auf bis zu 650 TB Speicher – pro Stack.
iPAC-Stacks können geclustert werden, so dass mehrere IPAC – Stacks als ein System administriert werden kann.
Werden die Traces erzeugt und gespeichert , werden diese automatisch auf bekannte Fehler-Symptome analysiert, und ihr Zustand farblich markiert.

Mehr Infos dazu unter iTM >

Triggered Capture

Incidents können automatische Capture- Files erzeugen und downloaden, die in einem separaten Speicher zV. stehen.

Dabei können Filter nicht nur für die betroffenen, sondern auch für die verbundenen Systeme definiert werden.

Erlebt z.B. ein Server eine hohe Reset Rate zu einem anderem System, wird als Tracefilter die beidseitige Kommunikation verwendet – und nicht nur die IP Adresse des Incident- auslösenden Systems.

SLIC can significantly expand the existing functions of an existing monitoring solution and also make the information visible for service management.

By correlating with external data, different service levels can be correlated with one another, which significantly improves the transparency of the business services.