Apriori 节点模型选项
模型名称。用户可根据目标或标识字段自动生成模型名称(未指定此类字段时自动生成模型类型)或指定一个定制名称。
最低前提条件支持度。您可以指定针对在规则集中保留规则的支持度标准。支持度指的是训练数据中条件(规则中的“if”部分)为真的记录的百分比。(请注意,此支持度定义与 CARMA 和序列节点中使用的定义不同。有关更多信息,请参阅序列节点模型选项主题。)如果您希望获得应用于很小部分数据的规则,请尝试增大此设置。
注: Apriori 的支持度定义基于带有前提条件的记录的数目。
这与 CARMA 和序列算法不同,对于这两种算法,支持度定义基于具有规则中所有项(即条件和结果)的记录的数量。关联模型的结果显示(条件)支持度和规则支持度两个测量。
最低规则置信度。您还可以指定置信度标准。置信度基于其规则的前提条件为 true 的记录,并且是其结果也为 true 的记录的百分比。换句话说,置信度是基于规则的正确预测的百分比。置信度低于指定标准的规则将被放弃。如果您获得的规则太多,请尝试增加此设置。如果您获得的规则太少(甚至根本无法获得规则),请尝试降低此设置。
注: 如果需要,您可以在自己的值中突出显示值和类型。 请注意,如果将置信度值减小至小于 1.0,那么构建规则的过程不仅需要使用大量可用内存,而且极为耗时。
最大前提条件数。您可以为任何规则指定最大前置条件数。这是一种用来限制规则复杂性的方式。如果规则太复杂或者太具体,请尝试降低此设置。此设置对于训练时间也具有很大的影响。如果规则集训练所需的时间过长,请尝试降低此设置。
仅包含标志变量的 true 值。如果对于表格(数据表)格式的数据选择了此选项,则在生成的规则中只会包括真值。这样可能有助于使得规则更容易理解。该选项不适用于事务格式的数据。有关更多信息,请参阅表格数据与事务处理数据主题。
注: 如果字段类型为标志,那么 CARMA 模型构建节点在构建模型时会忽略空的记录,而 Apriori 模型构建节点会包含空的记录。 空的记录是模型构建中使用的所有字段值均为 false 的记录。
优化。根据您的具体需求,选择旨在提高模型构建性能的选项。
- 选择速度可指示算法从不使用磁盘溢出,以便提高性能。
- 选择内存可指示算法在合适的时候,以牺牲某些速度为代价使用磁盘溢出。缺省情况下,此选项处于选中状态。注: 以分布式方式运行时,options.cfg 文件中指定的管理员选项可能会覆盖此设置。 有关更多信息,请参阅《IBM® SPSS® Modeler Server 管理员指南》。