IBM® SPSS® Modeler の強力な機能の 1 つとして、データ値を変更して、既存のデータから新しいフィールドを作成できることがあげられます。長期間にわたるデータ・マイニング・プロジェクトでは、Web ログ・データから顧客 ID を抽出したり、トランザクション・データや人口統計データから顧客の生涯価値を作成するような、新しいデータの作成が一般的に行われます。これらの変換はすべて、さまざまなフィールド設定ノードを使用して行うことができます。
さまざまなノードで、新規フィールドを作成することができます。
|
フィールド作成ノードで、1 つまたは複数の既存フィールドから、データ値を変更するか、新しいフィールドを作成します。これで、 タイプ式、フラグ、名義、ステート、カウント、および条件式の各フィールドが作成されます。 |
|
データ分類ノードにより、あるカテゴリー値のセットが別のセットに変換されます。データ分類は、カテゴリーを再編成したり、分析用のデータをグループ化しなおす場合に役立ちます。 |
|
データ分割ノードで、既存の 1 つまたは複数の連続型 (数値範囲) フィールドの値に基づいて、自動的に新しい名義型 (セット型) フィールドを作成します。例えば、連続型収入フィールドを、平均からの偏差による収入グループを含む、新しいカテゴリー・フィールドに変換することができます。新規フィールドのビンを作成すると、分割点に基づいてフィールド作成ノードを生成することができます。 |
|
フラグ設定ノードで、1 つ以上の名義型フィールドに定義されたカテゴリー値に基づいた、複数のフラグ型フィールドが派生します。 |
|
再構成ノードで、名義型またはグラグ型フィールドを、これから別のフィールドの値で埋めることができるフィールドのグループへ変換します。例えば、credit、cash、および debit の値の payment type という名前のフィールドがある場合、3 つの新しいフィールド (credit、cash、debit) が作成されます。その各々には、実際の支払の値を含めることができます。 |
|
時系列ノードにより、以前レコードのフィールドのデータを含む、新規フィールドが作成されます。時系列ノードは、多くの場合、時系列データなどの継続的なデータに使用されます。時系列ノードを使用する前に、ソート・ノードを使用して、データをソートしておくこともできます。 |
フィールド作成ノードの使用
フィールド作成ノードを使用して、1 つまたは複数の既存フィールドから、6 種類の新規フィールドを作成することができます。
- 式: 新規フィールドは任意の CLEM 式の結果です。
- フラグ型: 新規フィールドは、指定した条件を示すフラグ型です。
- 名義: 新規フィールドは名義型であり、そのメンバーは指定した値のグループです。
- 状態。新規フィールドは、2 つの状態 (ステート) のどちらかです。これら 2 つの状態は指定した条件によって切り替えられます。
- 度数: 新規フィールドは、条件を満たした回数を基準に決まります。
- 条件式: 新規フィールドは、条件の値に応じて、2 つの式のどちらかの値になります。
これらのノードには、それぞれの「フィールド作成ノード」ダイアログ・ボックスに、特別な一連のオプションが用意されています。これらのオプションは、以降の各項目で説明しています。