Startseite topics Was ist AIOps? Was ist AIOps?
Hier erfahren Sie, wie künstliche Intelligenz für den IT-Betrieb (Artificial Intelligence for IT Operations, AIOps) anhand von Daten und maschinellem Lernen das IT-Service-Management verbessert und automatisiert
IBM Newsletter abonnieren So lässt sich die App-Leistung mit AIOps steigern
Schwarz-blauer Hintergrund
Was ist AIOps?

Unter dem von Gartner geprägten Begriff AIOps – künstliche Intelligenz für den IT-Betrieb – versteht man den Einsatz der Möglichkeiten der künstlichen Intelligenz (KI), wie z. B. Verarbeitung natürlicher Sprache und Modelle für maschinelles Lernen, für die Automatisierung und Rationalisierung aktiver Workflows.

Vor allem Big Data, Analysen und maschinelles Lernen werden von AIOps für folgenden Aufgaben eingesetzt:

  • Erfassen und Aggregieren der riesigen und immer weiter anwachsenden Datenvolumen, die von verschiedenen IT-Infrastrukturkomponenten, Anwendungsanforderungen, Performance-Monitoring-Tools und Service-Ticketing-Systemen erzeugt werden
  • Intelligentes Herausfiltern von „Signalen“ aus den „Störgeräuschen“, damit signifikante Ereignisse und Muster in Bezug auf Probleme mit der Leistung und Verfügbarkeit von Anwendungen erkennbar werden.
  • Ursachendiagnose und Berichterstattung an IT und DevOps für eine schnelle Reaktion und Behebung – oder in manchen Fällen auch automatische Behebung der Probleme ohne menschliches Zutun. 

AIOps vereint mehrere separate, manuelle Tools für den IT-Betrieb in einer einzigen intelligenten und automatisierten IT-Betriebsplattform. So können die IT-Betriebsteams mit durchgängiger Transparenz und umfassendem Kontext schneller – und sogar proaktiv – auf nachlassende Leistung und Betriebsunterbrechungen reagieren.

Die Kluft zwischen einer immer vielfältigeren, dynamischeren und schwieriger zu überwachenden IT-Umgebung und isolierten Teams auf der einen Seite und den Erwartungen der Benutzer, die wenige oder überhaupt keine Unterbrechungen in der Leistung und Verfügbarkeit von Anwendungen wünschen, auf der anderen Seite wird dadurch überbrückt. Die meisten Experten sehen in AIOps die Zukunft des IT Operations Management, und der Bedarf wird weiter steigen, weil die Unternehmen den Fokus zunehmend auf Initiativen zur digitalen Transformation legen.

Implementierung von AIOps

Der Weg zu AIOps sieht in jedem Unternehmen anders aus. Wenn Sie erst einmal wissen, wo Sie auf Ihrem Weg zu AIOps stehen, können Sie mit der Aufnahme von Tools beginnen, mit deren Hilfe die Teams IT-Betriebsprobleme beobachten, vorhersagen und schnell handeln können. Für die Tools zur Verbesserung von AIOps in Ihrem Unternehmen wünschen Sie sich sicherlich folgende Funktionen:

Beobachtbarkeit: Beobachtbarkeit bezieht sich auf Software-Tools und -praktiken zum Aufnehmen, Aggregieren und Analysieren eines stetigen Stroms von Leistungsdaten aus einer verteilten Anwendung und der Hardware, auf der sie ausgeführt wird. Sie soll eine effektivere Überwachung und Fehlerbehebung der Anwendung gewährleisten, damit die Erwartungen an das Kundenerlebnis, Service Level Agreements (SLAs) und andere Geschäftsanforderungen erfüllt werden können. Diese Lösungen verschaffen Ihnen durch Aggregation und Konsolidierung von Daten eine ganzheitliche Sicht auf Ihre Anwendungen, Ihre Infrastruktur und Ihr Netz, ergreifen jedoch keine Korrekturmaßnahmen zum Beheben von IT-Problemen. Sie erfassen und aggregieren allerdings IT-Daten aus einer Vielzahl von Datenquellen in verschiedenen IT-Domänen. Die Endbenutzer werden auf potenzielle Probleme aufmerksam gemacht und von den IT-Serviceteams wird die Umsetzung der erforderlichen Korrekturmaßnahmen erwartet. Die Daten und die entsprechenden Visualisierungen dieser Tools sind zwar wertvoll, schaffen aber eine Abhängigkeit von IT-Organisationen, wenn es darum geht, Entscheidungen zu treffen und auf technische Probleme angemessen zu reagieren. Eine Ressourcenoptimierung, bei der Betriebssysteme von einem Bediener manuell aktualisiert werden müssen, wird in dynamischen Bedarfssituationen wohl nicht von großem Nutzen sein.

Vorhersageanalysen: AIOps-Lösungen können Daten analysieren und korrelieren, damit bessere Einblicke und automatisierte Abläufe entstehen. So können IT-Teams die Kontrolle über die immer komplexeren IT-Umgebungen behalten und die Anwendungsleistung sicherstellen. Die Möglichkeit, Probleme zu korrelieren und einzugrenzen, ist für jedes IT-Betriebsteam ein großer Fortschritt. So werden Probleme schneller erkannt, die andernfalls in der Organisation womöglich überhaupt nicht entdeckt worden wären. Automatische Anomalieerkennung, Alerts und Lösungsempfehlungen verringern die Gesamtausfallzeit wie auch die Anzahl der Vorfälle und Tickets. Die dynamische Ressourcenoptimierung kann mittels Vorhersageanalyse automatisiert werden. Das kann die Anwendungsleistung sicherstellen und gleichzeitig die Ressourcenkosten auch bei stark schwankendem Bedarf gefahrlos senken.

Proaktive Reaktion: Manche AIOps-Lösungen reagieren proaktiv auf unvorhergesehene Ereignisse, wie z. B. nachlassende Leistung und Betriebsunterbrechungen, und bringen Anwendungsleistung und Ressourcenmanagement in Echtzeit miteinander in Einklang. Wenn Metriken für die Anwendungsleistung in Vorhersagealgorithmen einfließen, können sie Muster und Trends erkennen, die sich bei verschiedenen IT-Problemen decken. Wenn IT-Probleme vorhergesagt werden können, bevor sie auftreten, können AIOps-Tools relevante, automatisierte Prozesse einleiten und Probleme schnell beheben. Die Vorteile der intelligenten Automatisierung zeigen sich z. B. in Form einer kürzeren mittleren Erkennungszeit (Mean Time to Detection, MTTD).

Diese Art von Technologie ist die Zukunft des IT Operations Management, denn sie kann zu einem besseren Mitarbeiter- und Kundenerlebnis beitragen. AIOps-Systeme stellen nicht nur sicher, dass IT-Service-Probleme zeitnah behoben werden, sondern bilden auch ein Sicherheitsnetz für IT-Betriebsteams. Es fängt Probleme auf, die sonst aufgrund menschlicher Versäumnisse wie organisatorischer Silos, unterbesetzter Teams usw. durch die Maschen fallen könnten. 

Vorteile von AIOps

AIOps haben den umfassenderen Vorteil, dass nachlassende Leistung und Betriebsunterbrechungen im IT-Betrieb schneller erkannt, angegangen und behoben werden können, als es bei manueller Durchsicht von Alerts aus verschiedenen IT-Betriebstools möglich wäre. Daraus ergeben sich mehrere entscheidende Vorteile:

  • Kürzere mittlere Problembehebungszeit (Mean Time to Resolution, MTTR): AIOps blendet die „Störgeräusche“ im IT-Betrieb aus und korreliert Betriebsdaten aus verschiedenen IT-Umgebungen. Dadurch kann es Ursachen ermitteln und Lösungen schneller und genauer vorschlagen, als es einem Menschen möglich wäre. So können Unternehmen bisher unvorstellbare MTTR-Ziele festlegen und erreichen. Die IT-Infrastruktur von Vivy konnte beispielsweise die mittlere Reparaturzeit (Mean Time to Repair, MTTR) für die App des Unternehmens um 66 %, d. h. von drei Tagen auf einen Tag oder weniger, verkürzen.
  • Niedrigere Betriebskosten: Die automatische Erkennung von Betriebsproblemen und neu programmierte Reaktionsskripts senken die Betriebskosten und ermöglichen eine bessere Ressourcenzuordnung. Das setzt auch Personalressourcen frei, die für innovativere und komplexere Aufgaben genutzt werden können, was die Mitarbeitererfahrung verbessert. Durch die Optimierung konnte Providence mehr als 2 Millionen US-Dollar einsparen und gleichzeitig die App-Leistung bei hoher Systemauslastung sicherstellen.
  • Bessere Beobachtbarkeit und Zusammenarbeit: Verfügbare Integrationen in AIOps-Überwachungstools ermöglichen eine effektivere teamübergreifende Zusammenarbeit zwischen DevOps-, ITOps-, Governance- und Sicherheitsfunktionen. Durch bessere Sichtbarkeit, Kommunikation und Transparenz können diese Teams die Entscheidungsfindung verbessern und schneller auf Probleme reagieren. Dealerware sorgte zum Beispiel für eine stärkere Beobachtbarkeit seiner containerbasierten Architektur und konnte dadurch die App-Leistung während der Pandemie steigern und die Bereitstellungslatenz um 98 % reduzieren.

Vom reaktiven zum proaktiven und dann zum vorausschauenden Management: Anhand der integrierten prädiktiven Analysefunktionen lernt AIOps ständig dazu und kann die dringendsten Alerts immer besser erkennen und priorisieren, damit die IT-Teams potenzielle Probleme in Angriff nehmen können, bevor sie zu nachlassender Leistung oder Betriebsunterbrechung führen. Electrolux konnte durch eine kürzere mittlere Erkennungszeit (MTTD) die Zeit zur Behebung von IT-Problemen von 3 Wochen auf eine Stunde verkürzen und durch Automatisierung von Reparaturaufgaben mehr als 1.000 Stunden pro Jahr einsparen.

Anwendungsfälle für AIOps

Mit Big Data, erweiterten Analysen und maschinellem Lernen kann AIOps die folgenden Anwendungsfälle bewältigen:

  • Ursachenanalyse: Wie der Name schon sagt, wird bei der Ursachenanalyse die eigentliche Ursache von Problemen ermittelt, damit sie mit geeigneten Lösungen behoben werden können. Wenn die Ursache bekannt ist, müssen die Teams sich nicht mit der Behandlung von Symptomen abgeben, sondern können sich mit dem Kernproblem befassen. So kann eine AIOps-Plattform beispielsweise die Ursache eines Netzausfalls aufspüren und sofort beheben. Sie kann außerdem Schutzmaßnahmen einrichten, um ähnliche Probleme in Zukunft zu verhindern.
  • Anomalieerkennung: AIOps-Tools können große Mengen historischer Daten durchsuchen und atypische Datenpunkte innerhalb von Datensätzen aufspüren. Solche Ausreißer sind „Signale“, die auf problematische Ereignisse, wie z. B. Datenschutzverletzungen hindeuten. Kostspielige Konsequenzen wie negative PR, Bußgelder und Vertrauensverluste bei den Verbrauchern lassen sich auf diese Weise vermeiden. 
  • Performance Monitoring: Moderne Anwendungen sind oft durch mehrere Abstraktionsebenen getrennt, so dass schwer zu verstehen ist, welche zugrunde liegenden physischen Server-, Speicher- und Netzressourcen welche Anwendungen unterstützen. Mit AIOps lässt sich das beheben. AIOps fungiert als Überwachungstool für Cloudinfrastruktur, Virtualisierung und Speichersysteme und erstellt Berichte zu Metriken wie Nutzung, Verfügbarkeit und Antwortzeiten. Darüber hinaus werden Funktionalitäten zur Ereigniskorrelation zum Konsolidieren und Aggregieren von Informationen eingesetzt, was den Endbenutzern zu einem besseren Informationskonsum verhilft.  
  • Cloudeinführung/Migration: Bei den meisten Unternehmen erfolgt die Cloudeinführung schrittweise und nicht auf einen Schlag. Dadurch entsteht eine hybride Multicloud-Umgebung (private Cloud, öffentliche Cloud, mehrere Anbieter) mit zahlreichen Abhängigkeiten, die sich so schnell und häufig verändern, dass sie nicht dokumentiert werden können. Mit klaren Einblicke in diese gegenseitigen Abhängigkeiten kann AIOps die operationellen Risiken der Cloud-Migration und eines Hybrid-Cloud-Konzepts drastisch reduzieren.
  • Einführung von DevOps: DevOps verschafft den Entwicklungsteams mehr Möglichkeiten zur Bereitstellung und Neukonfiguration der Infrastruktur und beschleunigt so die Entwicklung. Diese Infrastruktur muss von der IT aber dennoch verwaltet werden. AIOps sorgt für die Transparenz und Automatisierung, die die IT zur Unterstützung von DevOps ohne großen zusätzlichen Verwaltungsaufwand benötigt.
Wie funktioniert AIOps?

Am besten ist die Funktionsweise von AIOps zu verstehen, wenn man die Rolle der einzelnen AIOps-Komponententechnologien – Big Data, maschinelles Lernen und Automatisierung – in diesem Prozess betrachtet.

Anhand einer Big-Data-Plattform führt AIOps isolierte IT-Betriebsdaten, Teams und Tools an einem Ort zusammen. Diese Daten können Folgendes umfassen:

  • Historische Leistung- und Ereignisdaten
  • Streaming von Betriebsereignissen in Echtzeit
  • Systemprotokolle und Metriken
  • Netzdaten, einschließlich Paketdaten
  • Auf Vorfälle bezogene Daten und Ticketing
  • Daten zum Anwendungsbedarf
  • Infrastrukturdaten

AIOps setzt dann zielgerichtete Funktionalitäten für Analyse und maschinelles Lernen ein:

  • Herausfiltern signifikanter Ereignisalerts aus den „Störgeräuschen“: AIOps durchforstet Ihre IT-Betriebsdaten und trennt Signale, d. h. Alerts zu signifikanten abnormalen Ereignissen, von den Störgeräuschen (allem anderen).
  • Ermitteln der Ursachen und Vorschlagen von Lösungen: AIOps kann abnormale Ereignisse umgebungsübergreifend mit anderen Ereignisdaten korrelieren und so den Schwerpunkt auf die Ursache eines Ausfalls oder Leistungsproblems legen und Abhilfemaßnahmen vorschlagen.
  • Automatisieren von Reaktionen, einschließlich proaktiver Lösungen in Echtzeit: Als Mindestleistung kann AIOps Alerts und empfohlene Lösungen automatisch an die entsprechenden IT-Teams weiterleiten oder je nach Art des Problems und der Lösung sogar Teams zur Fehlerbehebung zusammenstellen. In vielen Fällen können anhand der Ergebnisse aus dem maschinellen Lernen automatische Systemreaktionen ausgelöst werden, die Probleme in Echtzeit beheben, noch bevor die Benutzer sie überhaupt bemerken.
  • Kontinuierliches Lernen zur besseren Bewältigung zukünftige Probleme: Mithilfe von KI-Modellen erfährt das System von Änderungen in der Umgebung und kann sich daran anpassen, z. B. an eine neue Infrastruktur, die von DevOps-Teams bereitgestellt oder neu konfiguriert wurde.
Weiterführende Lösungen
IBM® Turbonomic®

Wichtige Tätigkeiten können Sie kontinuierlich in Echtzeit – und ohne menschliches Zutun – automatisieren und damit proaktiv die effizienteste Nutzung von Rechen-, Speicher- und Netzwerkressourcen für Ihre Anwendungen auf jeder Ebene des Stacks ermöglichen.

IBM Turbonomic kennenlernen
IBM Instana® Observability

Erweitern Sie Ihr Application Performance Monitoring und stellen Sie den zur schnelleren Behebung von Vorfällen erforderlichen Kontext bereit.

KI-gestützte Automatisierung kennenlernen
IBM AIOps Insights

AIOps Insights ist eine SaaS-Lösung, die die Probleme zentraler IT-Betriebsteams bei der Verwaltung der Verfügbarkeit von IT-Ressourcen eines Unternehmens mit einem KI-gestützten Ereignis- und Vorfallsmanagement angeht und behebt.

Mehr zu AIOps Insights
AIOps für IBM zSystems

Verbessern Sie Systemmanagement, IT-Betrieb, Anwendungsleistung und operative Ausfallsicherheit mit künstlicher Intelligenz auf dem Großrechner.

Mehr zu AIOps für IBM zSystems
Gehen Sie den nächsten Schritt

Mit IBM AIOps kann die Anwendungsleistung bei gleichzeitiger Senkung der IT-Kosten sichergestellt werden. Es konnte eine Anwendungsverfügbarkeit von 99,99 % und eine Verkürzung der MTTD für Serviceproblemen um 55 % erzielt werden. Sorgen Sie mit IBM AIOps für außergewöhnliche Kundenerlebnisse. Erfahren Sie, wie Sie mit AIOps einen ROI von 471 % erzielen und die Ausgaben für den Einsatz der öffentlichen Cloud um 33 % senken können. Durch intelligente IT-Automatisierung mit IBM AIOps lassen sich mithilfe bewährter Tools, Erkenntnisse und Experten im gesamten Unternehmen und in der IT hochwirksame Automatisierungsmöglichkeiten bestimmen und realisieren, die Ihnen zu besseren Geschäftsergebnissen verhelfen.

Mehr zum IBM AIOps-Portfolio