IBM Support

SPSS Statistics Missing Valuesの使用例

Question & Answer


Question

SPSS Statistics Missing Valuesの使い方がわかりませんので、使用例を紹介してください。

Answer

SPSS Statistics Missing Valuesを使用することで、データ中の欠損値を穴埋めすることができます。どこかの変数に欠損値がありますと、そのケースは多変量解析が出来ないのですが、平均値や最頻値などで穴埋めして、多変量解析に採用するという考えがあります。

Missing Valuesオプションでは、データの傾向から欠損値に穴埋めされる値を、他の変数から予測して穴埋めいたします。

■SPSS Statistics Missing Valuesを使ってみる

1. 製品付属のサンプルファイルである、以下のファイルを開きます。
C:\Program Files\IBM\SPSS\Statistics\23\Samples\Japanese\telco_missing.sav

通信回線の契約データですが、欠損値がある状態です。

2.メニューの[分析]→[多重代入]の中に、Missing Valuesオプションの機能が入っています。

[パターン分析]で欠損状況の確認ができ、[欠損データ値を代入]で実際のデータの下に欠損値を穴埋めしたデータを続けたデータセットを作成できます。

3.メニューの[分析]→[多重代入]→[パターン分析]をクリックし、[変数間の分析]に欠損があるかをチェックしたい変数を投入し、[OK]をクリックします。


4. [パターン分析]を実行いたしますと、データの状態を確認できます。最初の円グラフでは欠損値がどのくらいの割合で含まれているかをまとめております。30変数中10変数に欠損値があり、1,000ケース中525ケースに欠損値があり、30,000セル中792セルに欠損値があるといえます。


[変数の要約]テーブルで、変数ごとに具体的な欠損値の数を表にまとめます。[表示する欠損値の最小パーセント]を「10」としていたので、10%以上欠損値がある変数を表にしております。


欠損値パターンをグラフ化します。「全く欠損値がないケース」「家族全体の収入だけ欠損値があるケース」など、内部で欠損値パターンをまとめ、その番号ごとにグラフ化します。

5. メニューの[分析]→[多重代入]→[欠損データ値を代入]をクリックし、欠損値を穴埋めしたデータを作成します。


[変数]タブでは、どの変数を分析対象として、どのように出力するかを設定します。左の変数リストから、右の[モデル内の変数]に「教育のレベル」以外の変数を投入します。

[分析の重み付け]を設定しますと、この変数で指定した値を掛け合わせた穴埋め値になります。

[代入]は穴埋めされる値をいくつ用意するかを設定します。1,000件のケースに対して[代入]を「5」と設定した場合、もともとの1,000件の下に、穴埋めした1,000件を5パターン追記して、合計6,000ケースのデータになります。

[代入データの位置]では[新しいデータセットを作成]か、[新しいファイルに書き込み]を選択できます(分析元データに追記はいたしません)。[新しいデータセットを作成]では、指定のデータセット名ですぐに画面表示し、ファイルとして保存をしません。[新しいファイルに書き込み]では、指定の*.savファイルに保存して画面に表示しません。

6. [方法]タブでは、欠損値の代入方法を指定します。[自動]を選べば、データスキャンの設定に合わせた手法が自動的に設定されます。


[ユーザー指定]を選択いたしますと、反復計算で値を推定する[マルコフ連鎖モンテカルロ法(MCMC)]による穴埋めか、それを行わない[単調]を選択できます。

[スケール変数のモデルの種類]では、スケール尺度変数の穴埋めに使う方法を選択します。[線型回帰]を選択すれば、線型回帰モデルによる穴埋めを行います。[予測平均照合(PMM)]は、線型回帰の結果を実際に入っているデータに合わせて調整した値で穴埋めします。

7. [制約条件]タブでは、データをスキャンした結果を確認し、それを踏まえた設定を行うことができます。[データをスキャン](スキャン済みの場合は[データを再スキャン])をクリックして[変数の要約]を表示してから内容を検討してください。


[制約条件を定義]の[役割]で、この変数を予測変数のみに使うか、欠損値の穴埋めのみに使うか、予測変数と穴埋めの両方に使うかを選択できます。

[予測変数としてのみ]に使用すれば、変数の穴埋めのモデル作成に使用されますが、欠損値の穴埋めはいたしません。[代入のみ]に設定すれば、この変数自体を穴埋めのモデル作成に使用しませんが、他の変数によるモデルで欠損値の穴埋めを行います。[予測変数として代入および使用する]に設定しますと、変数の穴埋めのモデル作成に使用して、欠損値の穴埋めも行います。必要に応じて設定を変更してください。

8. [出力]タブでは、実行結果をどうするかを設定します。[表示]枠の[代入モデル]にチェックをすれば、データセットに欠損値を穴埋めしたデータが追記されます。


[反復の記述]枠の[反復の記述を作成]にチェックをすれば、反復計算の過程を別のデータセットとして出力します。

9. [欠損データ値を代入]ダイアログで[OK]をクリックして実行いたしますと、最初の変数が「Imputation_」となり、元のデータか、欠損値を穴埋めした何番目のデータかを区別します。実際に穴埋めをした欄は色付きになり、予測モデルによって代入された値を確認できます。


「5.」の[代入]で設定した数だけ、欠損値を穴埋めしたデータを作成します。変数「Imputation_」の値を同じとするものごとに分析して、その結果を統合してご利用ください

欠損値の予測モデルは、線型回帰モデルをもとに、マルコフ連鎖モンテカルロ法(MCMC)で反復計算を行い、必要に応じて予測平均照合(PMM)で補正したものです。詳しくは「IBM SPSS Statistics Algorithms.pdf」の「Multiple Imputation Algorithms」の章をご参照ください。

[{"Type":"MASTER","Line of Business":{"code":"LOB10","label":"Data and AI"},"Business Unit":{"code":"BU059","label":"IBM Software w\/o TPS"},"Product":{"code":"SSLVMB","label":"IBM SPSS Statistics"},"ARM Category":[{"code":"a8m0z0000000Ca7AAE","label":"AAJapanese-\u003EStatistics"}],"ARM Case Number":"","Platform":[{"code":"PF025","label":"Platform Independent"}],"Version":"All Versions"}]

Document Information

Modified date:
23 June 2022

UID

swg21998626