線性迴歸

您可以利用「線性迴歸」來估計線性方程式的係數,此線性方程式跟一個或多個自變數有關 (這些自變數可以正確地預測應變數值)。 例如,您可以根據年齡、教育層級、經歷之類的自變數,來預測一位推銷員的年銷售額(應變數)。

範例。 一個藍球隊在一季中贏球的次數,與球隊每場的平均得分有關嗎? 從散佈圖中我們可以知道,這兩者是呈線性相關的。 獲勝的場次與對手的平均得分也是呈線性相關的。 但這些變數為負相關。 也就是說,當贏球的次數增加時,對手的平均得分便隨之減少。 利用線性迴歸,您可以從這些變數關係中,找出一種模式。 一個好的模式,可以用來預測球隊的贏球次數。

統計資料。 適用於每一個變數:有效觀察值個數、平均數和標準差。 適用於每一個模型:迴歸係數、相關性矩陣、部分和偏相關、複相關係數 RR 2、調整的 R 2R 2 變量、估計值的標準誤、變異數分析摘要表、預測值、殘差。 同時還有每個迴歸係數的 95% 信賴區間、變異數/共變異數矩陣、變異數擴張因素、容差、Durbin-Watson 檢定、距離測量(Mahalanobis、Cook 和槓桿值)、DfBeta 值、Df 適合度、預測區間和依觀察值順序診斷資訊。 繪圖:散佈圖、殘差散佈圖、直方圖和常態機率圖。

線性迴歸的資料考量

資料、 應變數和自變數應該都是數值變數。 類別變數 (如宗教、主修範圍、居住地區) 都需要重新編碼為二元 (虛擬) 變數、或其他類型的對比變數。

假設。 對自變數的每個值而言,應變數的分佈必須是常態的。 對所有自變數數值而言,應變數分佈的變異性,應該都是常數。 應變數和每個自變數之間的關係,應該是線性的,而且所有觀察值應該互不相關。

線性迴歸分析的執行程序

本功能需要 Statistics Base 選項。

  1. 從功能表中選擇:

    分析 > 迴歸 > 線性 ...

  2. 從「線性迴歸」對話框中,選取數值的應變數。
  3. 選取一個 (或以上的) 數值自變數。

您可以選擇性地:

  • 在區塊中輸入一組自變數,並為不同的變數子集指定不同的輸入方式。
  • 選擇一個選取變數,以便限制只能分析具有此變數之某數值的觀察值子集。
  • 選取觀察值識別變數,用以識別圖形上的某些點點。
  • 選取一個「加權最小平方法之權數」數值變數以用於加權最小平方法分析。

WLS可讓您取得加權最小平方模型。 資料點是由其變異數倒數來加權。 這表示有大變異數的觀察值與小變異數相關的觀察值相比,前者對於分析的影響比較小。 如果加權變數為零、負數或遺漏值,那麼分析時,會排除這個觀察值。

此程序會貼上 REGRESSION 指令語法。