贝叶斯网络节点专家选项

使用节点专家选项可微调模型构建过程。要访问专家选项,请在“专家”选项卡上将“模式”设置为专家

缺失值。缺省情况下,IBM® SPSS® Modeler 仅使用对模型中所用的全部字段具有有效值的记录。(这种方式有时称为缺失值的 成列删除 。)如果有很多缺失数据,您可能会发现这种方式去除的记录过多,剩余记录不足以生成较好的模型。在这种情况下,可以取消选中仅使用完整记录选项。IBM SPSS Modeler 随后将尝试使用尽可能多的信息来估算模型,包括其中一些字段具有缺失值的记录。(这种方式有时称为缺失值的 成对删除 。)但在某些情形下,以这种方式使用不完整记录可能会在模型的估计过程中产生计算问题。

追加所有概率。指定是否将输出字段每个类别的概率添加到该节点所处理的每条记录。如果未选中此选项,那么仅添加预测类别的概率。

独立性检验。一种独立评估检验,用于评估两个变量中成对的观测值是否相互独立。请从以下可用选项中选择要使用的检验类型:

  • 似然比。通过计算两种不同假设下结果的最大概率之间的比率来检验目标-预测变量的独立性。
  • Pearson 卡方。通过使用零假设(所观察事件的相对出现频率遵循指定的频率分布)来检验目标-预测变量的独立性。

贝叶斯网络模型可在检验对之外使用附加变量执行独立性的条件检验。此外,模型不仅可以研究目标和预测变量之间的关系,还可研究预测变量自身之间的关系。

注: 只有在“模型”选项卡上选中马尔可夫覆盖的包括特征选择预处理步骤结构类型时,独立性检验选项才可用。

显著性水平。可以与独立性检验设置结合使用,通过此选项,您可以在执行检验时设置要使用的分界值。该值越小,网络中的链接就越少;缺省水平值为 0.01。

注: 只有在“模型”选项卡上选中马尔可夫覆盖的包括特征选择预处理步骤结构类型时,此选项才可用。

最大条件集大小。该算法用于创建马尔可夫覆盖结构,它使用大小不断增加的条件集来执行独立性检验并从网络中移除不需要的链接。由于包含大量条件变量的检验需要更多的时间和内存进行处理,因此您可以限制要包括的变量数目。在处理众多变量间具有较强独立性的数据时,这种操作非常有用。但请注意,最终形成的网络可能包含一些多余链接。

指定执行独立性检验时要使用的条件变量的最大数目。缺省设置为 5。

注: 只有在“模型”选项卡上选中马尔可夫覆盖的包括特征选择预处理步骤结构类型时,此选项才可用。

特征选择。通过这些选项,您可以限制在处理模型时所使用的输入数,以便加快模型构建过程。由于在创建马尔可夫覆盖结构时存在大量的潜在输入,因此该操作特别有用;通过此项操作,您可以选择与目标变量有重大关联的输入。

注: 只有在“模型”选项卡上选中包括特征选择预处理步骤时,特征选择选项才可用。
  • 始终选择输入。通过使用“字段选择器”(文本字段右侧的按钮),从数据集中选择构建贝叶斯网络模型时始终使用的字段。目标字段始终处于选中状态。请注意,如果其他检验认为某些项不重要,那么在模型构建过程中,贝叶斯网络可能仍然会从此列表中删除这些项。因此,该选项仅确保列表中的项用在模型构建过程中,而不确保它们绝对显示在生成的贝叶斯模型中。
  • 最大输入数。指定构建贝叶斯网络模型时要使用的来自数据集中的总输入数。您可以输入的最大数目为数据集中的总输入量。
    注: 如果在始终选择输入中选择的字段数超过最大输入数的值,那么将显示一条错误消息。