線性迴歸

您可以利用「線性迴歸」來估計線性方程式的係數，此線性方程式跟一個或多個自變數有關 (這些自變數可以正確地預測應變數值)。例如，您可以根據年齡、教育層級、經歷之類的自變數，來預測一位推銷員的年銷售額（應變數）。

範例。 一個藍球隊在一季中贏球的次數，與球隊每場的平均得分有關嗎？從散佈圖中我們可以知道，這兩者是呈線性相關的。獲勝的場次與對手的平均得分也是呈線性相關的。但這些變數為負相關。也就是說，當贏球的次數增加時，對手的平均得分便隨之減少。利用線性迴歸，您可以從這些變數關係中，找出一種模式。一個好的模式，可以用來預測球隊的贏球次數。

統計資料。 適用於每一個變數：有效觀察值個數、平均數和標準差。適用於每一個模型：迴歸係數、相關性矩陣、部分和偏相關、複相關係數 R、R ²、調整的 R ²、R ² 變量、估計值的標準誤、變異數分析摘要表、預測值、殘差。同時還有每個迴歸係數的 95% 信賴區間、變異數/共變異數矩陣、變異數擴張因素、容差、Durbin-Watson 檢定、距離測量（Mahalanobis、Cook 和槓桿值）、DfBeta 值、Df 適合度、預測區間和依觀察值順序診斷資訊。繪圖：散佈圖、殘差散佈圖、直方圖和常態機率圖。

線性迴歸的資料考量

資料、 應變數和自變數應該都是數值變數。類別變數 (如宗教、主修範圍、居住地區) 都需要重新編碼為二元 (虛擬) 變數、或其他類型的對比變數。

假設。 對自變數的每個值而言，應變數的分佈必須是常態的。對所有自變數數值而言，應變數分佈的變異性，應該都是常數。應變數和每個自變數之間的關係，應該是線性的，而且所有觀察值應該互不相關。

線性迴歸分析的執行程序

本功能需要 Statistics Base 選項。

從功能表中選擇：
分析 > 迴歸 > 線性 ...
從「線性迴歸」對話框中，選取數值的應變數。
選取一個 (或以上的) 數值自變數。

您可以選擇性地：

在區塊中輸入一組自變數，並為不同的變數子集指定不同的輸入方式。
選擇一個選取變數，以便限制只能分析具有此變數之某數值的觀察值子集。
選取觀察值識別變數，用以識別圖形上的某些點點。
選取一個「加權最小平方法之權數」數值變數以用於加權最小平方法分析。

WLS。可讓您取得加權最小平方模型。資料點是由其變異數倒數來加權。這表示有大變異數的觀察值與小變異數相關的觀察值相比，前者對於分析的影響比較小。如果加權變數為零、負數或遺漏值，那麼分析時，會排除這個觀察值。

此程序會貼上 REGRESSION 指令語法。