類別主成分分析 (CATPCA)

這個程序可在縮小資料的維度時,同時量化類別變數。 類別主成分分析也可稱為 CATPCA,為 categorical principal components analysis 的縮寫。

主成分分析的目的,是要將原始的變數集,縮小為較小的不相關成分集,這些成分可代表在原始變數中所發現的大部分資訊。 當使用大量的變數,而無法有效解釋個體 (受試者和單位) 之間的關係時,這個技巧十分有用。 藉由縮減維度,您只需要解釋小部分元件,而不需解釋一大堆的變數。

在標準主成分分析中,系統假設數值變數之間為線性關係。 而另一方面,最適尺度方法能讓變數調整為不同層級。 在指定維度內的類別變數則進行最佳量化。 如此一來,變數之間的非線性關係,就變成可以分析了。

範例。 利用類別主成分分析,可以用圖形的方式,顯示工作類別、工作部門、地區、旅遊次數 (高、中、低)、和工作滿意度之間的關係。 您可能會發現兩個維度便可以說明許多變異數。 第一個維度會區隔工作類別與地區,而第二個維度則區隔工作部門與旅遊次數。 您同時也會發現,高工作滿意度,是與中旅遊次數相關。

統計量與圖形。 頻次、遺漏值、最適尺度層級、眾數、依重心座標說明的變異數、向量座標、每個變數和每個維度的總和、向量量化變數的成份負荷量、類別變數的量化和座標、疊代歷程、轉換後變數的相關性與相關性矩陣的特徵值、原始變數的相關性與相關性矩陣的特徵值、個體分數、類別圖、聯合類別圖、轉換圖、殘差圖、投影重心圖、個體圖、雙序圖、三角散佈圖、和成份負荷量圖。

類別主成分分析資料考量

資料。 字串變數值一定都會以遞增的文數字順序,轉換成正整數。 使用者定義的遺漏值、系統遺漏值和小於 1 的值都視為遺漏值;您可以重新編碼或新增常數到變數中,讓小於 1 的變數成為非遺漏值。

假設。 資料最少必須含有三個有效觀察值。 分析時須使用正整數資料。 離散化選項將自動分類分數值的變數,也就是用接近「正常的」分佈來分類其數值,並自動將字串變數的值轉換成正整數。 您可以指定其他的離散化分法。

相關程序。 如果您是以數值層級,來製作所有變數的尺度的話,就可產生標準的主成分分析。 若要使用其他繪製功能,可以在標準線性主成分分析中使用轉換變數。 如果所有變數都有多重名義尺度層級,那麼類別主成分分析便與多重對應分析相同。 如果您想要使用一組變數,那麼應該使用類別 (非線性) 典型相關分析。

若要取得類別主成分分析

此功能需要「類別」選項。

  1. 從功能表中選擇:

    分析 > 維度縮減 > 最適尺度 ...

  2. 選取部分變數為非多重名義
  3. 選取 一個集
  4. 按一下 定義
  5. 選擇兩個以上的分析變數,然後指定解答中的維度數。
  6. 按一下確定

您可以選擇指定補充變數,該變數可能適合所發現的解答、或標記圖形中的變數。

此程序會貼上 CATPCA 指令語法。