線性迴歸
您可以利用「線性迴歸」來估計線性方程式的係數,此線性方程式跟一個或多個自變數有關 (這些自變數可以正確地預測應變數值)。 例如,您可以根據年齡、教育層級、經歷之類的自變數,來預測一位推銷員的年銷售額(應變數)。
範例。 一個藍球隊在一季中贏球的次數,與球隊每場的平均得分有關嗎? 從散佈圖中我們可以知道,這兩者是呈線性相關的。 獲勝的場次與對手的平均得分也是呈線性相關的。 但這些變數為負相關。 也就是說,當贏球的次數增加時,對手的平均得分便隨之減少。 利用線性迴歸,您可以從這些變數關係中,找出一種模式。 一個好的模式,可以用來預測球隊的贏球次數。
統計資料。 適用於每一個變數:有效觀察值個數、平均數和標準差。 適用於每一個模型:迴歸係數、相關性矩陣、部分和偏相關、複相關係數 R、R 2、調整的 R 2、R 2 變量、估計值的標準誤、變異數分析摘要表、預測值、殘差。 同時還有每個迴歸係數的 95% 信賴區間、變異數/共變異數矩陣、變異數擴張因素、容差、Durbin-Watson 檢定、距離測量(Mahalanobis、Cook 和槓桿值)、DfBeta 值、Df 適合度、預測區間和依觀察值順序診斷資訊。 繪圖:散佈圖、殘差散佈圖、直方圖和常態機率圖。
線性迴歸的資料考量
資料、 應變數和自變數應該都是數值變數。 類別變數 (如宗教、主修範圍、居住地區) 都需要重新編碼為二元 (虛擬) 變數、或其他類型的對比變數。
假設。 對自變數的每個值而言,應變數的分佈必須是常態的。 對所有自變數數值而言,應變數分佈的變異性,應該都是常數。 應變數和每個自變數之間的關係,應該是線性的,而且所有觀察值應該互不相關。
線性迴歸分析的執行程序
本功能需要 Statistics Base 選項。
- 從功能表中選擇:
- 從「線性迴歸」對話框中,選取數值的應變數。
- 選取一個 (或以上的) 數值自變數。
您可以選擇性地:
- 在區塊中輸入一組自變數,並為不同的變數子集指定不同的輸入方式。
- 選擇一個選取變數,以便限制只能分析具有此變數之某數值的觀察值子集。
- 選取觀察值識別變數,用以識別圖形上的某些點點。
- 選取一個「加權最小平方法之權數」數值變數以用於加權最小平方法分析。
WLS。 可讓您取得加權最小平方模型。 資料點是由其變異數倒數來加權。 這表示有大變異數的觀察值與小變異數相關的觀察值相比,前者對於分析的影響比較小。 如果加權變數為零、負數或遺漏值,那麼分析時,會排除這個觀察值。
此程序會貼上 REGRESSION 指令語法。