操作详细信息(自动数据准备)

在“操作摘要”主视图中选择任何带有下划线的操作时显示,“操作详细信息”链接视图显示所执行的每个处理步骤的操作相关与通用信息。首先显示操作相关的详细信息。

对于每个操作,描述用作标题位于链接视图的顶部。操作相关详细信息显示在标题下方,可能包括派生预测变量数目、字段重新设计、目标转换、类别合并或重新排序和预测变量构建或排除等详细信息。

在处理每个操作时,在处理过程中使用的预测变量数可能会变化,例如,排除或合并预测变量。

:如果某个操作已关闭,或未指定目标,则在“操作摘要”主视图中单击该操作时,会在操作详细信息位置显示一条错误消息。

有 9 个可能的操作,不过对于每个分析而言,这些操作并非都有必要使用。

文本字段表

该表显示下列项的数目:

  • 从分析中排除的预测变量。

日期和时间预测变量表

该表显示下列项的数目:

  • 从日期和时间预测变量派生的持续时间。
  • 日期和时间元素。
  • 派生的日期和时间预测变量总数。

如果已计算了任何日期持续时间,则参考日期或时间将显示为脚注。

预测变量过滤表

该表显示从处理中排除的以下预测变量数目:

  • 常量。
  • 缺失值过多的预测变量。
  • 在单个类别中有太多个案的预测变量。
  • 类别过多的名义字段(集合)。
  • 过滤出的预测变量总数。

检查测量级别表

该表显示重新设计、分解成以下项的字段数目:

  • 重新强制转换为连续字段的有序字段(有序集合)。
  • 重新强制转换为有序字段的连续字段。
  • 重新设计总数。

如果输入字段(目标或预测变量)并非连续或有序,这将显示为脚注。

离群值表

该表显示离群值处理方式的计数。

  • 发现并修整其离群值的连续字段数,或发现离群值并将其设为缺失值的连续字段数,具体取决于您在“设置”选项卡的“准备输入和目标”面板上的设置。
  • 由于在离群值处理后为常量,而被排除的连续字段数。

离群值分界值显示为脚注。如果输入字段(目标或预测变量)不是连续的,还会显示另一个脚注。

缺失值表

该表显示已替换缺失值、分解为以下项目的字段数:

  • 目标。如果未指定目标,则不显示此行。
  • 预测变量。它将进一步分解为名义(集合)、有序(有序集合)和连续特征数。
  • 被替换的缺失值总数。

目标表

该表显示目标是否被转换,显示为:

  • 到正态的 Box-Cox 转换。这将进一步分解为显示指定标准(平均值和标准差)和 Lambda 的列。
  • 对其重新排序以提高稳定性的目标类别。

分类预测变量表

该表显示以下分类预测变量的数目:

  • 按最低到最高重新排序其类别以提高稳定性。
  • 合并其类别以最大化目标关联。
  • 合并其类别以处理松散类别。
  • 由于与目标关联程度过低而被排除。
  • 由于在合并后为常量而被排除。

如果没有分类预测变量,则显示相应脚注。

连续预测变量表

有两个表。第一个表格显示以下转换数之一:

  • 转换成标准单位的预测变量值。此外,还会显示转换的预测变量数、指定的平均值和标准差。
  • 映射到通用范围的预测变量值。此外,还会显示通过最值法转换的预测变量数,以及指定的最小值和最大值。
  • 分箱化的预测变量值和预测变量数。

第二个表显示预测变量空间构建详细信息,显示为以下预测变量的数目:

  • 已构建。
  • 由于与目标关联程度过低而被排除。
  • 由于在分箱化后为常量而被排除。
  • 由于在构建后为常量而被排除。

如果未输入连续预测变量,则显示相应脚注。