Bayes-Netzknoten

Mithilfe des Bayes-Netzknotens können Sie ein Wahrscheinlichkeitsmodell erstellen, indem Sie beobachtete und aufgezeichnete Hinweise mit "gesundem Menschenverstand" kombinieren, um die Wahrscheinlichkeit des Vorkommens unter Verwendung scheinbar nicht miteinander verknüpfter Attribute zu ermitteln. Der Knoten ist speziell für Netze vom Typ "Tree Augmented Naïve Bayes" (TAN) und "Markov-Decke" gedacht, die in erster Linie zur Klassifizierung verwendet werden.

Bayes-Netze dienen zur Erstellung von Vorhersagen in vielen verschiedenen Situationen. Hier einige Beispiele:

Ermitteln von Antragstellern für Kredite mit geringem Risiko der Zahlungsunfähigkeit.
Abschätzung, zu welchem Zeitpunkt für Geräte Wartungsarbeiten, Ersatzteile oder ein Austausch erforderlich ist, basierend auf Sensoreingaben und vorhandenen Datensätzen.
Lösen von Kundenproblemen mithilfe von Online-Tools zur Fehlerbehebung.
Diagnostizierung und Fehlerbehebung bei Mobiltelefonnetzen in Echtzeit.
Abschätzen des potenziellen Risikos und Nutzens von Forschungs- und Entwicklungsprojekten mit dem Ziel, die Ressourcen auf die aussichtsreichsten Möglichkeiten zu konzentrieren.

Ein Bayes-Netz ist ein grafisches Modell, das Variablen (häufig als Knoten bezeichnet) in einem Dataset und die probabilistischen bzw. bedingten Unabhängigkeiten zwischen den Variablen anzeigt. Durch Bayes-Netze können kausale Beziehungen zwischen Knoten angezeigt werden; die Verbindungen in den Netzen (auch als arcs (Bögen) bezeichnet) stehen jedoch nicht unbedingt für ein direktes Verhältnis von Ursache und Wirkung. Mithilfe eines Bayes-Netzes kann beispielsweise die Wahrscheinlichkeit berechnet werden, dass ein Patient unter einer bestimmten Krankheit leidet. Diese Berechnung beruht auf dem Vorliegen bzw. Fehlen bestimmter Symptome sowie anderen relevanten Daten und setzt voraus, dass sich die probabilistischen Unabhängigkeiten zwischen Symptomen und Krankheiten, die im Diagramm angezeigt werden, als wahr erweisen. Netze sind bei fehlenden Informationen sehr robust und führen zu der bestmöglichen Vorhersage unter Nutzung aller vorhandenen Informationen.

Ein typisches, einfaches Beispiel eines Bayes-Netzes wurde von Lauritzen und Spiegelhalter (1988) erstellt. Es wird häufig als das "Asien-Modell" bezeichnet und ist eine vereinfachte Version eines Netzes, das zur Diagnostizierung neuer Patienten eines Arztes verwendet werden kann. Die Richtung der Verbindungen entspricht in etwa der Kausalität. Jeder Knoten steht für eine Facette, die mit dem Zustand des Patienten in Beziehung stehen könnte. So zeigt "Smoking" (Rauchen) an, dass sie Raucher sind und "VisitAsia" (BesuchAsien) zeigt an, ob sie sich in letzter Zeit in Asien aufgehalten haben. Wahrscheinlichkeitsbeziehungen werden durch die Verbindungen zwischen Knoten angezeigt. So erhöht das Rauchen beispielsweise sowohl die Wahrscheinlichkeit, dass ein Patient Bronchitis entwickelt, als auch die Wahrscheinlichkeit, dass er Lungenkrebs entwickelt, während das Alter nur mit der Möglichkeit der Entwicklung von Lungenkrebs verknüpft zu sein scheint. Ebenso gilt, dass Anomalien auf einem Röntgenbild der Lungen entweder durch Tuberkulose oder Lungenkrebs verursacht werden können, während die Wahrscheinlichkeit, dass ein Patient an Atemnot (Dyspnoe) leidet, erhöht ist, wenn der Patient auch an Bronchitis oder Lungenkrebs leidet.

Abbildung 1. Asien-Netzbeispiel von Lauritzen und Spiegelhalter

Es gibt mehrere Gründe, die für die Verwendung eines Bayes-Netzes sprechen können:

Es bietet Einblicke in Kausalbeziehungen. Ausgehend davon trägt es zum Verständnis eines Problembereichs bei und ermöglicht es, die Folgen von Eingriffen vorauszusagen.
Das Netz bietet einen effizienten Ansatz zur Vermeidung einer Überanpassung an die Daten.
Es bietet eine deutliche Visualisierung der beteiligten Beziehungen.

Anforderungen. Die Zielfelder müssen kategorial sein und können das Messniveau Nominal, Ordinal oder Flag aufweisen. Als Eingaben kommen Felder jedes Typs infrage. Stetige Eingabefelder (numerischer Bereich) werden automatisch klassiert. Bei verzerrten Verteilungen erzielen Sie jedoch möglicherweise bessere Ergebnisse, wenn Sie die Felder vor dem Bayes-Netzknoten manuell mithilfe eines Klassierknotens klassieren. Verwenden Sie beispielsweise "Optimales Klassieren", wenn das Supervisorfeld mit dem Feld Ziel des Bayes-Netzknotens übereinstimmt.

Beispiel. Ein Analyst einer Bank möchte in der Lage sein vorherzusagen, welche Kunden bzw. potenzielle Kunden mit hoher Wahrscheinlichkeit mit ihren Kreditrückzahlungen in Verzug geraten. Mithilfe eines Bayes-Netzmodells können Sie die Merkmale von Kunden ermitteln, die mit hoher Wahrscheinlichkeit zahlungsunfähig werden, und mehrere Modellarten erstellen, um herauszufinden, welches Modell die potenziell zahlungsunfähigen Personen am besten vorhersagt.

Beispiel. Ein Telekommunikationsbetreiber möchte die Anzahl der Kunden, die abwandern, verringern und das Modell monatlich mit den Daten des jeweiligen Vormonats aktualisieren. Mithilfe eines Bayes-Netzmodells können Sie die Merkmale von Kunden ermitteln, die mit hoher Wahrscheinlichkeit abwandern werden, und das Modell weiterhin jeden Monat mit neuen Daten trainieren.