KDE 节点

Kernel Density Estimation (KDE)© 使用 Ball Tree 或 KD Tree 算法以进行效率查询,并且游走于无监督学习、特征工程和数据建模。基于相邻元素的方法(例如,KDE)是最流行且最有用的一些密度估算方法。可在任意数量的维度执行 KDE,但是在实践当中,高维数可能导致性能下降。SPSS® Modeler 中的 KDE 建模和 KDE 模拟节点公开 KDE 库的核心特征和常用参数。节点使用 Python 进行实现。1

要使用 KDE 节点,必须设置上游“类型”节点。KDE 节点将从“类型”节点(或者上游源节点的“类型”选项卡)读取输入值。

KDE 建模节点位于 SPSS Modeler 的“建模”选项卡和 Python 选项卡上。 “KDE 建模”节点生成一个模型块,并且块的评分值是来自输入数据的核心密度值。

KDE 模拟节点位于“输出”选项卡和 Python 选项卡上。“KDE 模拟”节点生成 KDE Gen 源节点,后者可创建一些使用相同分布作为输入数据的记录。KDE Gen 节点包含“设置”选项卡,可在其中指定节点将创建的记录数(缺省值为 1)并生成随机种子。

有关 KDE 的更多信息,包括示例,请参阅 KDE 文档 (http://scikit-learn.org/stable/modules/density.html#kernel-density-estimation)。1

1 “User Guide”。Kernel Density Estimation。Web. © 2007-2018,scikit-learn developers。