ROC 分析

受試者工作特徵 (ROC) 分析是用來評量模型預測正確性的一個有用方法,評量方式是繪製分類檢定的靈敏度與(1-特異度)(因為臨界值在診斷檢定結果的整個範圍會改變)。位於給定 ROC 曲線或 AUC 下的完整區域會制定重要的統率量來代表以下機率:針對從觀察值群組中隨機選取的一個受試者以及從控制群組中隨機選取的另一個受試者觀察檢定變數時,將會以正確的順序進行預測。「ROC 分析」支援對單一 AUC、查準率-查全率 (PR) 曲線進行推理,並提供選項用來比較根據獨立群組或配對受試者產生的兩個 ROC 曲線。

PR 曲線會繪製查準率與查全率,當觀察資料樣本高度扭曲時該曲線往往更加有用,並且它針對在類別分佈中有很大偏差的資料提供 ROC 曲線的替代方案。

範例
銀行依利息將客戶分成兩種,會借貸者與不會借貸者,因此便發展出這類特殊模型,以執行這類判斷。ROC 分析可用來評估和評量模型預測的正確性。
Statistics
AUC、負面群組、遺漏值、正面分類、截斷值、確信強度、兩端漸近信賴區間、分佈、標準誤、獨立群組設計、配對樣本設計、無母數假設、雙負指數分佈假設、中間點、分割點、PR 曲線、逐步插入、漸近顯著性(兩尾)、靈敏度和(1-特異度)、查準率與查全率。
方法
會比較位於兩個 ROC 曲線下根據獨立群組或配對受試者產生的區域。在兩個比較診斷方法產生的正確性方面,比較兩個 ROC 曲線可以提供更多資訊。

ROC 分析資料考量

資料
PR 曲線會繪製查準率與查全率,當觀察資料高度扭曲時此曲線往往更加有用。簡單的線性插補可能錯誤地產生過於樂觀的 PR 曲線估計。
假設
針對從觀察值群組中隨機選取的一個受試者以及從控制群組中隨機選取的另一個受試者觀察檢定變數時,將會以正確的順序進行預測。每一個定義的群組將至少包含一個有效的觀察。單個程序只會使用一個分組變數。

取得 ROC 分析

此功能需要 Statistics 基本版。

  1. 從功能表中選擇:

    分析 > 分類 > ROC 分析

  2. 按一下選取檢定變數區段下的選取變數,選取一個以上檢定機率變數,然後按一下確定
  3. 選取預設的獨立群組設計設定時,按一下群組變數區段下的選取變數,選取單一變數以分組觀察值,然後按一下確定

    選取數值分組變數時,您可以按一下群組變數旁邊的群組:鏈結以要求檢定變數的獨立群組設計,並指定兩個值、一個中間點或一個分割點。如需相關資訊,請參閱ROC 分析:定義群組

  4. 按一下狀態變數區段下的選取變數,選取單一狀態變數,然後按一下確定
  5. 按一下狀態變數旁邊的定義狀態* 鏈結,以識別狀態變數的正數值。在指定正數狀態值之後,按一下確定
  6. 選擇性地選取配對樣本設計設定,以要求檢定變數的配對樣本設計。在某個狀態變數關聯的相同受試者上測量多個檢定值時,配對樣本設計會比較配對樣本情境中的兩個 ROC 曲線。
    註: 如果選取了配對樣本設計,則會停用群組變數分配假設(位於「分類」對話框中)選項。
  7. 選擇性地展開「其他設定」功能表,然後按一下下列項:
    • 按一下分類,以定義截斷值、檢定方向及曲線下區域的標準誤。
    • 按一下統計量,以選取要包含在程序中的統計量。
    • 按一下圖形,以定義 ROC 和查準率-查全率曲線的繪製。
    • 按一下選項,以指定遺漏值設定。
  8. 按一下執行分析

此程序會貼上ROC 分析指令語法。