クロス集計表の統計
カイ 2 乗: 2 つの行と 2 つの列から構成される表の場合、「カイ 2 乗」を選択して、Pearson のカイ 2 乗、尤度比カイ 2 乗、Fisher の直接法、Yates の修正カイ 2 乗 (連続性のための修正) を計算します。 2 × 2 の表の場合、大きめの表の欠損行または列の結果が得られない表が 5未満の予想周波数を持つセルを持っている場合、 Fisherの正確検定が計算されます。 他の 2 × 2 表については、「イェーツの補正カイ 2 乗」が計算されます。 任意の数の行と列から構成される表の場合、「カイ 2 乗」を選択して、Pearson のカイ 2 乗と尤度比カイ 2 乗を計算します。 どちらの表変数も量的変数である場合、「カイ 2 乗」により、線型と線型による連関検定が得られます。
「相関」。 : 順序付けられた値が行と列の両方に含まれている表の場合、「相関」により、Spearman の相関係数とロー (数値データのみ) が得られます。 Spearman のローは、ランク順位間の関連度です。 どちらの表変数 (因子) も量的変数である場合、「相関」により、Pearson の相関係数、r、変数間の線型による関連度が得られます。
名義: 名義型データ (カトリック、プロテスタント、ユダヤ教などの固有の順序はありません) の場合、 分割係数 (Contingency coefficient)、 ファイ (係数) Cramér の V、 ラムダ (対称および非対称のラムダ、Goodman と Kruskal のタウ)、および 不確定性係数を選択できます。
- 分割係数: カイ 2 乗に基づく関連度。 値の範囲は 0 から 1 までです。 値が 0 の場合は行変数と列変数の間に関連がないことを示し、値が 1 に近い場合は変数の間に強い関連があることを示します。 取り得る最大値は、 テーブルの行と列の数によって決まります。
- Phi and Cramer 's V。 ファイは、カイ 2 乗に基づく関連度の指標です。 カイ 2 乗統計量を標本サイズで割った結果の平方根を取ります。 Cramer の V は、カイ 2 乗に基づく関連度です。
- Lambda。 従属変数の値を予測するために独立変数の値を使用するときの、誤差の削減比を反映する関連度。 値が 1 の場合は、独立変数によって従属変数が完全に予測されます。 値が 0 の場合、独立変数で従属変数を予測することはできません。
- 不確定性係数: 変数の値を予測するために別の変数の値を使用するときの 予測連関指数を示す関連度。 例えば値 0.83 は、一方の変数が判明すると、 もう一方の変数の値を予測するときに誤差が 83% 低下することを示します。 本プログラムは、 不確定性係数の対称版と非対称版の両方を計算します。
序数。 順序付けられた値が行と列の両方に含まれている表の場合、「ガンマ」(2 次元表の場合は 0 次、3 次元表から 10 次元表の場合は条件付き)、「Kendall のタウ b」、および「Kendall のタウ c」を選択します。 行カテゴリーから列カテゴリーを予測する場合は、「Somers の d」を選択します。
- ガンマ: 2つの順序変数の間の関連性を示す対称的な指標で、範囲は-1~1です。 絶対値1に近い値は、2つの変数の間に強い関係があることを示します。 値が 0 に近い場合は、関係が弱いかまったくないことを示します。 2 次元テーブルの場合は 0 次ガンマを表示します。 3 次元テーブルから n 次元テーブルの場合は、条件付きのガンマを表示します。
- Somers の d。 2つの順序変数の間の関連性を示す指標で、範囲は-1~1です。 絶対値1に近い値は、2つの変数の間に強い関係があることを示し、0に近い値は、2つの変数間にほとんど関係がないことを示します。 Somers の d はガンマを非対称に拡張したものであり、 独立変数の同順位でないペアの数を含める点だけが異なります。 この統計量の対称版も計算します。
- Kendall 's tau-b。 同順位を考慮に入れた、 順序変数 (ランク付けされた変数) のノンパラメトリックな相関度。 係数の符号は関係の方向を示します。 絶対値は強さを示し、絶対値が大きいほど関係が強いことを示します。 値の範囲は -1 から 1 までですが、-1 または +1 の値が得られるのは平方表の場合のみです。
- Kendall 's tau-c。 同順位を無視した、 順序変数のノンパラメトリックな関連度。 係数の符号は関係の方向を示します。 絶対値は強さを示し、絶対値が大きいほど関係が強いことを示します。 値の範囲は -1 から 1 までですが、-1 または +1 の値が得られるのは平方表の場合のみです。
間隔による名義。 一方の変数がカテゴリー変数で、もう一方の変数が量的変数の場合は、「イータ」を選択します。 カテゴリー変数は数値でコード化されている必要があります。
- イータ: 関連度の 1 つ。値の範囲は 0 から 1 までです。 値が 0 の場合は行変数と列変数の間に関連がないことを示し、値が 1 に近い場合は関連度が高いことを示します。 イータは、間隔尺度で測定される従属変数 (収入など) とカテゴリーの少ない独立変数 (性別など) に適しています。 イータ値は 2 つ計算されます。1 つは行変数を間隔変数として扱うものであり、もう 1 つは列変数を間隔変数として扱うものです。
カッパ: Cohen のカッパは、2 人の評価者が同じ対象を評価するときに、両者による評価の一致度を測定します。 値 1 は完全な一致を示します。 値 0 は、偶然以外の一致がないことを示します。 カッパは、行および列の値が同じスケールを表す平方表に基づきます。 一方の変数に観測値があり、他方の変数に観測値がないセルには、カウントが0になります。 2つの変数のデータ格納型(文字列または数値)が同じでない場合、カッパは計算されません。 文字列変数の場合は、両方の変数を同じ文字数で定義している必要があります。
リスク. 2 x 2 表の場合の、 因子の存在とイベントの発生の間の関連の強さの指標。 統計量の信頼区間に値 1 が含まれる場合、 その因子がそのイベントに関連していると想定することはできません。 因子の発生がまれな場合には、 オッズ比を推定値または相対リスクとして使用することができます。
McNemar. 関連する 2 つの二分変数を対象とするノンパラメトリック検定。 カイ 2 乗分布を使用して応答の変化を検定します。 「前後」デザインでの実験的介入による応答の変化を検出する場合に有用です。 大きな平方表の場合は、McNemar-Bowker 対称検定が報告されます。
Cochran と Mantel-Haenszel の統計量。 Cochran と Mantel-Haenszel の統計量は、1 つ以上の層 (制御) 変数によって定義された共変量パターンを条件として 2 値因子変数と 2 値応答変数の間の独立性を検定するために使用します。 他の統計量は層ごとに計算しますが、Cochran と Mantel-Haenszel の統計量はすべての層を対象にして一度に計算します。
クロス集計表の統計量を指定するには
この機能には Statistics Base オプションが必要です。
- メニューから次の項目を選択します。
- 「クロス集計表」ダイアログ・ボックスで、「統計」をクリックします。