欠損値

多くのデータ・ファイルには、ある程度の欠落データがあります。 欠落データは、さまざまな原因で発生します。 例えば、アンケート調査の回答者が一部の質問に答えない場合、特定の変数が一部のケースに適用されない場合、コーディング・エラーによって一部の値が消失された場合などです。

IBM® SPSS® Statisticsには、次の 2 種類の欠損値があります。

  • ユーザー欠損値。 欠落データを含むと定義された値。 これらの値には、データ欠損の理由を識別する値ラベルを割り当てることができます (例えば、男性の妊娠率に対するコード 99 および「適用外」という値ラベル)。
  • システム欠損値。 数値変数に値がない場合、その変数にはシステム欠損値が割り当てられます。 これは、データ・エディターの「データ・ビュー」でピリオドによって表されます。

欠損値による影響を補い、さらに欠落データのパターン分析にも使用できる数々の機能があります。 ただし、この セクションには、カスタム表が欠損データをどのように処理するか、および欠損データが要約統計量の計算にどのように影響するかを記述するという、より単純な目標があります。

サンプル・データ・ファイル

この セクション の例では、データ・ファイル missing_values.savを使用します。 詳しくは、トピック「 サンプル・ファイル 」を参照してください。 これは、欠損値の基本概念を説明することを目的として、非常にシンプルに、完全に人工的に作成されたデータ・ファイルであり、1 つの変数と 10 のケースしか含まれていません。