交叉列表統計量

卡方分佈。 如果表格中有兩個列和兩個行,請選取「卡方檢定」,以計算皮爾遜 (Pearson) 卡方分佈、概似比卡方分佈、費雪 (Fisher) 精確檢定,以及 Yates' 修正卡方檢定(連續修正)。 若為 2 × 2 表格,則在較大表格中未產生遺漏列或直欄的表格具有預期頻率小於 5 的儲存格時,會計算 Fisher 精確檢定。 為所有其他 2 x 2 表格計算 Yates 校正卡方。 至於那些具有任何列和行個數的表格,請選取「卡方分佈」,以計算皮爾遜 (Pearson) 卡方和概似比卡方分佈。 此外,當這兩個表格變數都是數值時,卡方分佈便會產生線性對線性關聯檢定。

相關性。 如果表格中的列和行都含有排序數值,相關便會產生斯皮爾曼相關係數與 rho 係數 (僅數值資料)。 其中,斯皮爾曼等級相關係數 (Spearman's Rho) 係數是等級順序之間的關聯性測量。 當表格變數(因素)都是數值時,相關會產生皮爾遜 (Pearson) 相關係數 r 值,這是變數間線性相關的測量。

名義。 如果是名義資料(它們無法真的排序,例如 Catholic(天主教徒)、Protestant(清教徒)和 Jewish(猶太教徒)),您可以選取列聯係數Phi (φ) 值(係數)、Cramér's VLambda (λ) (對稱性和非對稱性 Lambda (λ) 值與 Goodman and Kruskal's tau 測量),以及不確定性係數

  • 列聯係數以卡方為基礎的關聯量數。 數值範圍介於 0 和 1 之間,若數值為 0 則表示列變數與行變數之間沒有關聯;若數值趨近 1,則表示變數之間具有高度關聯性。 可能的最大值取決於表格中的列數及欄數。
  • Phi 及 Cramer VPhi 值是以卡方為基礎的關聯量數;將卡方統計量除以樣本大小,再取結果的平方根。 Cramer V 是以卡方為基礎的關聯量數。
  • Lambda使用自變數值來預測應變數值時,反映比例誤差縮減的關聯量數。 數值 1 表示自變數可完全預測應變數。 值 0 表示自變數無助於預測應變數。
  • 不確定係數使用一個變數值來預測另一個變數值時,表示比例誤差縮減的關聯量數。 例如,數值為 0.83 時,表示某個變數的知識會減少預測其他變數值 83 % 的誤差。 程式會計算不確定性係數的對稱及非對稱這兩種版本。

序數。 如果表格中的列和行都含有排序數值,請選取「Gamma」(雙向表格為零階,而三向至十向表則視情況而定)、「Kendall's tau-b 統計測量」和「Kendall's tau-c 統計測量」。 如要從列類別中預測行類別,請選取「Somers' d 值」。

  • γ在介於 -1 到 1 之間的兩個序數變數之間的關聯對稱測量。 接近絕對值 1 的值表示兩個變數之間的牢固關係。 若數值趨近於 0,則代表兩變數之間關係較疏遠或無任何關係。 若為雙向表格,則會顯示零階 gamma。 若為 3 向至多向表格,則會顯示條件 γ。
  • Somers ' d 值這是兩個序數變數之間的關聯量數,範圍從 -1 到 1。 接近絕對值 1 的值表示兩個變數之間有密切關係,而接近 0 的值表示變數之間關係較疏遠或毫無關係。 Somers' d 是 gamma 的不對稱延伸,唯一的不同在於它包含不與自變數等值的成對個數。 系統也會計算此統計量的對稱版本。
  • Kendall 's tau-b針對將同分值列入估計之序數變數或評等變數的無母數相關性量數。 係數符號表示關係的方向,而其絕對值表示長度,若絕對值越大,即表示關係越密切。 可能值範圍介於 -1 到 1 之間,但僅可從平方表格取得 -1 或 +1 的值。
  • Kendall 's tau-c針對忽略同分值之序數變數的無母數關聯性測量。 係數符號表示關係的方向,而其絕對值表示長度,若絕對值越大,即表示關係越密切。 可能值範圍介於 -1 到 1 之間,但僅可從平方表格取得 -1 或 +1 的值。

名義變數對區間變數。 當一個變數為類別,而另一個為數值時,請選取「Eta 值」。 類別變數必須以數值方式來編碼。

  • Eta一種範圍從 0 至 1 的關聯性量數,其中 0 表示列變數與欄變數之間沒有關聯性,而接近於 1 的值則表示具有高度關聯性。 Eta 適用於以區間尺度測量的應變數 (例如:收入),以及擁有一定類別個數的自變數 (例如:性別)。 這兩個 Eta 值的計算方式如下:其中一個 Eta 值會將列變數視為區間變數,而另一個 Eta 值則會將欄變數視為區間變數。

Kappa當兩名評估者針對相同物件進行評等時,Cohen Kappa 係數會測量其評估間的一致性。 數值 1 表示完全一致。 數值 0 表示一致性好壞不定。 Kappa 基於列和欄值皆代表相同尺度的平方表格。 當任何資料格具有其中一個變數的觀察值,但沒有另一個變數的觀察值時,則會將 0 指派為計數。 如果兩個變數的資料儲存類型(字串或數值)不相同,則 Kappa 不會計算。 對於字串變數,兩個變數必須具有相同的定義長度。

風險對於 2 x 2 的表格,這是顯示因素與發生事件之間的關聯性強度量數。 如果統計值的信賴區間包含數值 1,則您無法假設該因素與該事件是否有關聯。 您可以使用勝算比作為當因素甚少發生時,其相對風險的估計值。

McNemar. 針對兩相關二分變數的無母數檢定。 使用卡方分佈檢定回應值的變更。 在設計為「事件前後」的實驗類型中,若要偵測因實驗中斷所導致的回應值變更,這種檢定方法非常有用。 若為較大的平方表格,則會報告 McNemar-Bowker 對稱檢定。

Cochran 's 與 Mantel-Haenszel 統計量在由一個以上階層(控制)變數定義共變數型樣的條件下,Cochran 與 Mantel-Haenszel 統計量可用來檢定二分因素變數與二分回應變數之間的獨立性。 請注意,在逐層計算其他統計量時,會針對所有階層計算一次 Cochran 與 Mantel-Haenszel 統計量。

指定交叉列表的統計量

本功能需要 Statistics Base 選項。

  1. 從功能表中選擇:

    分析 > 敘述性統計量 > 交叉表 ...

  2. 在「交叉列表」對話框中,按一下統計量