貝葉斯網路節點

貝葉斯網路節點可讓您透過以下方式建立機率模型:結合觀察並記錄的證據與真實世界常識,使用看似不相關屬性以建立發生事件的可能性。該節點重點應用了樹狀結構擴展素樸貝葉斯 (TAN) 和馬爾可夫覆蓋網路,這些算法主要用於分類問題。。

貝葉斯網路可用於在多數不同的狀況下進行預測,範例如下:

  • 選取違約風險較低的貸款時機。
  • 根據感應器輸入和現有記錄,估計設備何時需要維修、增加零件或更換。
  • 借助線上疑難排解工具解決客戶問題。。
  • 即時診斷並排除移動電話網路故障。
  • 評估研發專案的潛在風險和回報,以在最佳時機集中資源。

貝葉斯網路是一種圖形模型,它顯示資料集中的變數(通常稱之為節點)以及這些變數之間隨機的或條件式的獨立性。貝葉斯網路可呈現節點之間的因果關係;但是,網路中的鏈結(也稱為)不一定呈現直接因果關係。例如,如果圖形中所顯示的症狀和疾病之間的機率性的獨立性成立,貝葉斯網路可根據特定症狀和其他相關資料是否存在,計算病患患有某種特殊疾病的幾率。這種網路非常穩健,即使在資訊遺漏時,也可以利用現有的任何資訊作出最佳預測。

標準的基礎貝葉斯網路範例由 Lauritzen 和 Spiegelhalter 於 1988 年建立。該網路示例是一種簡化的網路版本,通常稱作 "Asia" 模型,醫生可用它來診斷新病患的病情,所有鏈結的方向可大體指示因果關係。每個節點代表與病患狀況相關的一個方面,例如「吸煙」代表這些病患確為吸煙者,而 "VisitAsia" 代表他們最近是否去過亞洲。機率關係由所有節點之間的鏈結指示,例如,吸煙會增大病患患有支氣管炎和肺癌的幾率,而年齡僅與肺癌的患病率相關。同樣地,肺部 x 光檢查異常可能由肺結核或肺癌引起。同時,如果病患本身患有支氣管炎或肺癌,那麼他們更有可能出現呼吸急促(呼吸困難)症狀。

圖 1. Lauritzen 和 Spegelhalter 的 Asia 網路範例
Lauritzen 和 Spegelhalter 的 Asia 網路範例

以下是您有可能決定使用貝葉斯網路的幾點原因:

  • 它可協助您瞭解因果關係。由此,您可以瞭解出現問題的地方並可預測任何干涉可能引發的後果。
  • 該網路可提供避免資料過度配適的有效方法。
  • 可以輕鬆地觀測到所涉及關係的清晰視圖。

需求。目標欄位必須為種類且測量層次為名義序數旗標。輸入內容可以為任何類型的欄位。連續(數值型範圍)輸入欄位將自動分組;但是,如果分佈出現不對稱,則可使用貝葉斯網路節點之前的分組節點對欄位進行手動分組,從而獲得較好的效果。例如,在管理員欄位與貝葉斯網路節點目標欄位相同的位置處,使用最佳化分組。

範例。 銀行分析師希望可以預測可能拖欠償還貸款的客戶或潛在客戶。您可使用貝式網路模型來識別最有可能拖欠還款的客戶的特性,並建立幾種不同類型的模型,以確定哪種模型可以最好地預測潛在的貸款拖欠者。

範例。 一位電信運營商希望減少中斷服務(又稱為「流失」)的客戶數量,並使用上一個月的資料對模型每月進行更新。您可以使用貝式網路模型確定最有可能流失的客戶的特性,然後每月使用新資料繼續訓練該模型。