IBM Support

多項ロジスティック回帰

How To


Summary

線型回帰の従属変数「Y」の値をロジット変換で「0.000から1.000」の値に変換して「1.000=あり/0.000=なしを、回帰モデルで判定」した手法が二項ロジスティック回帰でしたが、二者択一の「0.000から1.000」を複数組み合わせてダミー変数で表現することで3カテゴリー以上の回帰分析を行ったものが、多項ロジスティック回帰となります。

Steps

1. 多項ロジスティック回帰の概要

線型回帰の従属変数「Y」の値をロジット変換で「0.000から1.000」の値に変換して「1.000=あり/0.000=なしを、回帰モデルで判定」した手法が二項ロジスティック回帰でしたが、二者択一の「0.000から1.000」を複数組み合わせてダミー変数で表現することで3カテゴリー以上の回帰分析を行ったものが、多項ロジスティック回帰となります

例えば「東京-大阪間の移動方法」など新幹線・航空機・高速バスの3カテゴリーを「0と1」の変数で表現する場合は、内部では変数をふたつ用意して、
新幹線:変数1が「1」、変数2が「0」
航空機:変数1が「0」、変数2が「1」
高速バス:変数1が「0」、変数2が「0」
で表すことでロジスティック回帰モデル化します。

独立変数にはスケール尺度変数だけでなくカテゴリー変数を因子として使用してオッズ比を算出することができます。オッズ比の利用で、例えば従属変数に「心臓病に罹患しているか」、独立変数のひとつに「喫煙の有無」を使用した二項ロジスティック回帰のオッズ比の利用で「喫煙者は非喫煙者の3倍くらい心臓病にかかる」という結論が可能になります。

2. 対応アプリケーション

SPSS Statistics Regression
SPSS Modeler

3. 項ロジスティック回帰分析

サンプルデータセット:

Windows「C:\Program Files\IBM\SPSS\Statistics\26\Samples\Japanese\telco.sav」

MacOS「/Applications/IBM/SPSS/Statistics/26/Samples/Japanese/telco.sav」

image-20200324101619-1

分析内容:従属変数「顧客カテゴリ」ごとに顧客属性情報の各独立変数の違いはあるか。

操作手順:

1.SPSS Statisticsを起動し、「telco.sav」を開きます。
2.SPSS Statisticsのメニューの[分析]→[回帰]→[多項ロジスティック]をクリックします。
3.[多項ロジスティック回帰]ダイアログにて[従属変数]欄に変数「顧客カテゴリ」を投入します。 独立変数は因子(カテゴリー変数)と共変量(スケール尺度変数)に入力欄が分かれ、[因子]欄に変数「婚姻状況」「教育レベル」「退職」「性別」を投入し、[共変量]欄に変数「年齢」「現在の住所」「世帯の収入」「現職の在籍年数」「世帯の同居人数」を投入します。
4.[多項ロジスティック回帰]ダイアログの[参照カテゴリ]ボタンをクリックし、[参照カテゴリ]ダイアログにて[最初のカテゴリ]を選択して最小値を参照して他の値をモデル化するように設定して、[続行]ボタンをクリックします。
5.[多項ロジスティック回帰]ダイアログの[モデル]ボタンをクリックし、[モデル]ダイアログにて[ユーザー指定/ステップワイズ ]を選択します。[ステップワイズの項]の横にある[項の構築]を[主効果]にしてから[因子と共変量]にある9つの変数を全て[ステップワイズの項]に投入します。[ステップワイズ 法]は[変数増加法投入]を選択して、[続行]ボタンをクリックします。
6.[多項ロジスティック回帰]ダイアログの[統計量]ボタンをクリックし、[統計]ダイアログにて[分類表]もチェックをして、[続行]ボタンをクリックします。
7.[ロジスティック回帰]ダイアログに戻って[OK]ボタンをクリックして実行します。

多項ロジスティック回帰も回帰式の数式ではなく数式に入る係数などを表形式で出力します。帰無仮説は「この独立変数は回帰式に含めない」であり有意確率が0.050未満であれば帰無仮説が棄却されて「この独立変数は回帰式に含めて良い」となります。ステップワイズ を実施したため独立変数は選択がされており、ステップワイズ の経緯を[ステップの要約]テーブルで確認することが出来ます。

0

[パラメーター推定値]テーブルに多項ロジスティック回帰の式に入るパラメーター係数の推定値が従属変数のカテゴリーごとに出力されます。回帰式に入るパラメータ係数は、実際の変数に対応する値が「B」となります[Exp(B)]がオッズ比となり、カテゴリー変数にて「この変数が1になれば、従属変数が1になる確率が◯倍になる」ということができます

1

[分類]テーブルでは分析元データでの従属変数の値(観測値)と多項ロジスティック回帰モデルが予測した値(予測値)の正解数の割合を算出して、モデルの当てはまり具合を確認することが出来ます。
2

(他の分析例)ユーザー様が一番利用しているSPSS Statisticsのオプションをうかがって従属変数とし、そのユーザー様の業務内容や属性情報を独立変数として多項ロジスティック回帰をすることで、「この業務にはこのオプションを求められる可能性が高い」を割り出す。

Document Location

Worldwide

[{"Business Unit":{"code":"BU059","label":"IBM Software w\/o TPS"},"Product":{"code":"SSLVMB","label":"IBM SPSS Statistics"},"ARM Category":[{"code":"a8m0z0000000Ca7AAE","label":"AAJapanese->Statistics"}],"ARM Case Number":"","Platform":[{"code":"PF025","label":"Platform Independent"}],"Version":"All Version(s)","Line of Business":{"code":"LOB10","label":"Data and AI"}}]

Document Information

Modified date:
15 July 2020

UID

ibm11143394