記述統計量

図1: 保有権の記述統計 (サービス月)
保有権の記述統計 (サービス月)

記述統計表には、代入値を持つ変数の要約が表示されます。 変数ごとに個別のテーブルが作成されます。 表示される統計量の種類は、変数がスケールかカテゴリーかによって異なります。

スケール変数の統計量には、元のデータに対して表示された度数、平均値、標準偏差、最小値、および最大値、代入された値の各セット、および (元のデータと代入された値を結合した) 完全なデータ・セットが含まれます。

「保有期間 (サービスありの月)」 の記述統計表には、元のデータの値とほぼ等しい値の各セットの平均値と標準偏差が表示されます。ただし、最小値を見て、 保有期間 の負の値が代入されていることを確認すると、すぐに問題が発生します。

図2: 婚姻状況の記述統計 (婚姻状況)
婚姻状況の記述統計 (婚姻状況)

カテゴリー変数の場合、統計量には、元のデータ、代入値、および完全なデータのカテゴリー別の度数とパーセントが含まれます。 「婚姻状況 (婚姻状況)」 のテーブルには、代入された値について、元のデータよりも多くの比率のケースが結婚していると推定されるという興味深い結果が表示されます。 これは、変量の変動が原因である可能性があります。あるいは、欠損の可能性がこの変数の値に関連している可能性があります。

図3: 収入の記述統計 (世帯収入 (千単位))
収入の記述統計 (世帯収入 (千単位))

旧世代およびその他のすべてのスケール変数と同様に、 「収入 (世帯収入 (千単位))」 には負の代入値が表示されます。特定の変数に対する制約を使用してカスタム・モデルを実行する必要があります。 ただし、 income は他の潜在的な問題を示しています。 各代入の平均値は、元のデータの平均値よりもかなり高く、各代入の最大値は、元のデータの平均値よりもかなり低くなります。 所得の分布は極めて右偏りが強い傾向があるため、これが問題の原因になる可能性があります。

次(X)