線性脊迴歸

線性 Ridge 使用 Python sklearn.linear_model.Ridge 類別來估計一或多個自變數上之應變數的 L2 或平方損失規則化線性迴歸模型,並包括選用模式來顯示追蹤圖,以及根據交叉驗證選取 alpha 超參數值。 當單一模型適合或使用交叉驗證來選取 alpha 時,可以使用保留資料的分割區來估計樣本外效能。

除了使用 α 規則化參數的指定值擬合模型之外,線性脊還可以顯示 α 值範圍的係數值的脊線追蹤圖,或透過在指定值網格上的 k 倍交叉驗證來促進超參數值的選擇。 如果單一模型適合或透過交叉驗證執行 alpha 選擇,則最終模型可以套用至由輸入資料分割區建立的保留資料,以取得模型的樣本外效能有效估計值。

取得線性脊迴歸分析

  1. 從功能表中選擇:

    分析 > 迴歸 > 線性 OLS 替代模型 >

    變數 」對話框可讓您指定變數,將作用中資料集中的每個觀察值指派給訓練或保留樣本。

  2. 選取數值目標變數。 只需要一個目標變數就能執行分析。
  3. 指定數值相依項。
  4. 指定至少一個類別因素變數或數值共變數變數。

選擇性地, 分割區 提供一種方法來建立輸入資料的保留或測試子集,以估計所指定或所選模型的樣本外效能。 對於程序所使用的任何變數,在成批刪除具有無效資料的任何觀察值之後,會執行所有分割。 請注意,對於交叉驗證,會在 Python中建立訓練資料的摺疊或分割區。 不論有效模式為何,分割區所建立的保留資料都不會用於預估。

可以透過指定隨機指派給每個樣本的觀察值比例 (在 訓練及保留分割下) ,或透過將每個觀察值指派給訓練或保留樣本的變數來定義分割。 您無法同時指定訓練和變數。 如果未指定分割區,則會建立大約 30% 輸入資料的保留樣本。

訓練% 指定作用中資料集內要隨機指派給訓練樣本的相對觀察值數目。 預設訓練為 70%。

此程序會貼上 LINEAR_RIDGE 指令語法。