IBM Support

COX回帰比例ハザード

How To


Summary

線型モデルにしても、ディシジョンツリーにしても、クラスター分析にしても、従来の統計モデルは何月何日の決まった日時時点の「状態」をモデル化しております。しかしある特定の日時で結論が出ないデータを分析したい場合も考えられます。重い病気の研究において入院なり通院なりで「治療中」や「完治による治療終了」(生存)の人もいれば、残念ながら「死亡に伴う治療終了」(死亡)もあります。このような「今も結果を追えるケース」と「途中離脱で結果が追えなくなってしまったケース」が混在していることに対応した分析が生存分析となります。発祥は医療に関するものですが、治療の継続や終了を「サブスクリプション契約の維持」「消耗する装置の耐久性」に置き換えて利用することも考えられます。

COX回帰(比例ハザードモデルとも呼びます)はロジスティック回帰の要素を盛り込んだ生存分析で、対象のイベント(例えば死亡)が発生に影響がある独立変数のハザード比(ロジスティック回帰でいうところのオッズ比)をモデル化することが出来ます。

Steps

1. COX回帰比例ハザードの概要

線型モデルにしても、ディシジョンツリーにしても、クラスター分析にしても、従来の統計モデルは何月何日の決まった日時時点の「状態」をモデル化しております。しかしある特定の日時で結論が出ないデータを分析したい場合も考えられます。重い病気の研究において入院なり通院なりで「治療中」や「完治による治療終了」(生存)の人もいれば、残念ながら「死亡に伴う治療終了」(死亡)もあります。このような「今も結果を追えるケース」と「途中離脱で結果が追えなくなってしまったケース」が混在していることに対応した分析が生存分析となります。発祥は医療に関するものですが、治療の継続や終了を「サブスクリプション契約の維持」「消耗する装置の耐久性」に置き換えて利用することも考えられます。

COX回帰(比例ハザードモデルとも呼びます)はロジスティック回帰の要素を盛り込んだ生存分析で、対象のイベント(例えば死亡)が発生に影響がある独立変数のハザード比(ロジスティック回帰でいうところのオッズ比)をモデル化することが出来ます。

2. 対応アプリケーション

SPSS Statistics Advanced Statistics
SPSS Modeler

3. COX回帰比例ハザードの実行

サンプルデータセット:
Windows「C:\Program Files\IBM\SPSS Statistics\Samples\Japanese\telco.sav 」
MacOS「/Applications/IBM SPSS Statistics/Resources/Samples/Japanese/telco.sav 」

data

分析内容:顧客情報から電話の解約予測モデルを作成する

操作手順:

1.SPSS Statisticsを起動し、「telco.sav」を開きます。メニューの[分析]→[生存分析]→[COX回帰]をクリックします。

2.[COX回帰分析]ダイアログにて、[生存変数]に変数「サービス継続期間(月単位)」、[状況変数]に変数「解約」を投入します。[事象の定義]ボタンをクリックし、ダイアログにて[1]を設定して[続行]ボタンで戻ってください。
(変数「サービス継続期間(月単位)」は期間を表す計測値変数です。変数「解約」の「1」という値が解約(生存分析の「死亡」)を表しております。)

3.[共変量]に変数を投入します。まず変数「年齢」「婚姻状況」「現在の住所」「教育レベル」「現職の在籍年数」「退職」「性別」「世帯の同居人数」を投入します。[方法]は[変数増加法:尤度比]を設定し、[次]ボタンをクリックします。2ブロックめでは変数「顧客カテゴリ」を投入し、[方法]は[強制投入法]を設定ます。
(回帰式の従属変数と独立変数をここで指定します。変数増加法は無関係な変数を除外するステップワイズ法の一種です。)


4.[カテゴリ]ボタンをクリックし、カテゴリ共変量に「婚姻状況」「教育レベル」「退職」「性別」「顧客カテゴリ」を投入します。今回は対比は[指標]、参照カテゴリは[最後]で統一しますので、そのまま[続行]をクリックします。
(数値が入っている「年齢」「現在の住所」「現職の在籍年数」「世帯の同居人数」はそのまま共変量として利用し、カテゴリ番号が入っている「婚姻状況」「教育レベル」「退職」「性別」「顧客カテゴリ」はここでそのことを宣言して、「はい/いいえ」の「いいえ」に相当する値を「最後に登場する数字」と定義します。モデルはブロックごとに別々に分析されます)

5.[作図]ボタンをクリックし、[累積生存確率][累積ハザード関数]にチェックをし、[個別の線]には変数「顧客(Cat)(平均(M))」を選択して[続行]をクリックします。

6.[OK]をクリックし、分析を実行しますと、出力ビューアにCOX回帰分析の結果がエクスポートされます。

7.[方程式中の変数]の[B]が回帰式における各変数のパラメータ値となります。有意確率が有意水準を下回れば回帰式に採用できます。

参照カテゴリが既婚で未婚に対して分析をしている「婚姻状況」のExp(B)が1.556なので、未婚の場合解約する可能性が既婚者の1.556倍になることがわかります。

(他の分析例)保守契約の継続にどの独立変数の影響が強いかをモデル化し、「最新バージョンの導入有無」や「過去1年間のサポートお問い合わせ回数」が効いていることを確認する。
ソーシャルゲームのログをもとにログインや課金の継続にどの独立変数の影響が強いかをモデル化し、課金額、プレイ時間、キャンペーンの参加、使用機種、個人情報がどれくらい効いているか確認する。

Document Location

Worldwide

[{"Business Unit":{"code":"BU059","label":"IBM Software w\/o TPS"},"Product":{"code":"SSLVMB","label":"IBM SPSS Statistics"},"ARM Category":[],"Platform":[{"code":"PF025","label":"Platform Independent"}],"Version":"All Version(s)","Line of Business":{"code":"LOB10","label":"Data and AI"}}]

Document Information

Modified date:
15 February 2022

UID

ibm16246963