IBM Support

Kaplan-Meier

How To


Summary

線型モデルにしても、ディシジョンツリーにしても、クラスター分析にしても、従来の統計モデルは何月何日の決まった日時時点の「状態」をモデル化しております。しかしある特定の日時で結論が出ないデータを分析したい場合も考えられます。重い病気の研究において入院なり通院なりで「治療中」や「完治による治療終了」(生存)の人もいれば、残念ながら「死亡に伴う治療終了」(死亡)もあります。このような「今も結果を追えるケース」と「途中離脱で結果が追えなくなってしまったケース」が混在していることに対応した分析が生存分析となります。発祥は医療に関するものですが、治療の継続や終了を「サブスクリプション契約の維持」「消耗する装置の耐久性」に置き換えて利用することも考えられます。

KaplanさんとMeierさんで20世紀に発表した生存分析であるKaplan-Meier生存分析は、バラバラである期間の初日からどれくらい調査を維持出来たかをモデル化する、時間を加味したノンパラメトリック検定となります。複数の治療法で一方は長期間延命出来たがもう一方はあまり延命出来ていないというような比較に使用することができます。患者の減少具合が治療法ごとに差があると言えるかを検定できます。

Steps

1. Kaplan-Meierの概要

線型モデルにしても、ディシジョンツリーにしても、クラスター分析にしても、従来の統計モデルは何月何日の決まった日時時点の「状態」をモデル化しております。しかしある特定の日時で結論が出ないデータを分析したい場合も考えられます。重い病気の研究において入院なり通院なりで「治療中」や「完治による治療終了」(生存)の人もいれば、残念ながら「死亡に伴う治療終了」(死亡)もあります。このような「今も結果を追えるケース」と「途中離脱で結果が追えなくなってしまったケース」が混在していることに対応した分析が生存分析となります。発祥は医療に関するものですが、治療の継続や終了を「サブスクリプション契約の維持」「消耗する装置の耐久性」に置き換えて利用することも考えられます。

KaplanさんとMeierさんで20世紀に発表した生存分析であるKaplan-Meier生存分析は、バラバラである期間の初日からどれくらい調査を維持出来たかをモデル化する、時間を加味したノンパラメトリック検定となります。複数の治療法で一方は長期間延命出来たがもう一方はあまり延命出来ていないというような比較に使用することができます。患者の減少具合が治療法ごとに差があると言えるかを検定できます

2. 対応アプリケーション

SPSS Statistics Advanced Statistics

3. Kaplan-Meierの実行

サンプルデータセット:
Windows「C:\Program Files\IBM\SPSS\Statistics\26\Samples\Japanese\pain_medication.sav 」
MacOS「/Applications/IBM/SPSS/Statistics/26/Samples/Japanese/pain_medication.sav 」

分析内容:新薬での治療で治療効果に差が出たか。

操作手順:

1.SPSS Statisticsを起動し、「 pain_medication.sav 」を開きます。
2.メニューの[分析]→[生存分析]→[Kaplan-Meier]をクリックします。
3.[Kaplan-Meier]ダイアログにて、[生存分析]に、時間を表す変数「効果までの時間[時間]」を投入します。
[状況変数]に、終結/調査打ち切りを識別している変数「効果状況[状況]」を投入します。[事象の定義]ボタンをクリックし、ダイアログにて終結のほうをを意味している単一値[1]を設定して、[続行]ボタンで戻ってください。
(変数「効果までの時間[時間]」は期間を表す計測値変数です。変数「効果状況[状況]」の「1」という値が効果あり(生存分析の「死亡」)を表しております。)
[因子]に、回帰式の独立変数に当たるカテゴリー変数「治療[治療]」を投入します。

4.[Kaplan-Meier]ダイアログにて[因子の比較]ボタンをクリックし、ダイアログにて[ログランク][Breslow][Tarone-Ware]にチェックを入れて、[続行]をクリックします。
5.[Kaplan-Meier]ダイアログにて[オプション]ボタンをクリックし、ダイアログにて[生命表][生存時間の平均値と中央値][4分位][生存推定値]にチェックを入れて、[続行]をクリックします。
6.[OK]をクリックし、分析を実行しますと、出力ビューアにKaplan-Meier分析の結果がエクスポートされます。
7.[生存率表]テーブルの[推定値]の推移で、[生存関数]グラフ(生存曲線)が描き出されます。

[全体の比較]テーブルの有意確率で、[状況変数]で識別された2群に差があるかを検定します。有意確率が有意水準を下回るときに「2つの生存曲線に差はない」という仮説が棄却されますので、有意確率が「0.050」未満の場合は仮説が棄却されて「2つの生存曲線に有意に差がある」ということになります

サンプルの場合はすべての検定が仮説が棄却されずに「2つの生存曲線に差はない」のままとなります

(他の分析例)「頻繁にサポートに問い合わせているお客様」と「ほとんどサポートを利用していないお客様」とで保守契約の契約年数に差が出たか。

Document Location

Worldwide

[{"Business Unit":{"code":"BU059","label":"IBM Software w\/o TPS"},"Product":{"code":"SSLVMB","label":"IBM SPSS Statistics"},"ARM Category":[],"Platform":[{"code":"PF025","label":"Platform Independent"}],"Version":"All Version(s)","Line of Business":{"code":"LOB10","label":"Data and AI"}}]

Document Information

Modified date:
14 July 2020

UID

ibm16246905