聚类分析
此功能在 SPSS® Statistics Premium Edition 或“直销”选项中可用。
聚类分析是用于揭示数据中的自然分组(或聚类)的探索性工具。例如,它可以根据各种人口统计和购买特征识别不同的客户组。
示例。零售和消费者产品公司定期地对描述客户的购买习惯、性别、年龄、收入水平等的数据应用聚类技术。这些公司为每个消费者群体设计营销和产品开发战略,以增加销售额和建立品牌忠诚度。
聚类分析数据注意事项
数据。此过程既处理连续字段也处理分类字段。每个记录(行)代表要聚类的客户,字段(变量)代表聚类所基于的属性。
记录顺序。 注意,结果可取决于记录顺序。为使顺序的影响降至最低,您可能会考虑随机排序记录。您可能想通过以不同随机顺序排序的记录来多次运行分析,以验证给定解的稳定性。
测量级别。正确指定测量级别是非常重要的,因为它会影响结果计算。
- 名义 (Nominal). 当变量值表示不具有内在等级的类别时,该变量可以作为名义变量;例如,雇员任职的公司部门。名义变量的示例包括地区、邮政编码和宗教信仰。
- 有序 (Ordinal). 当变量值表示带有某种内在等级的类别时,该变量可以作为有序变量;例如,从十分不满意到十分满意的服务满意度水平。有序变量的示例包括表示满意度或可信度的态度分数和优先选择评分。
- 连续。当变量值表示带有有意义的度规的已排序类别时,该变量可以作为刻度(连续)变量对待,以便在值之间进行合适的距离比较。刻度变量的示例包括以年为单位的年龄和以千美元为单位的收入。
每个字段旁的图标指示当前的测量级别。
数值(N) | 字符串(S) | 日期 | 时间 | |
---|---|---|---|---|
刻度(连续) | |
n/a | |
|
有序(O) | |
|
||
名义(N) |
可以在数据编辑器的“变量视图”中更改测量级别(有关详细信息,请参见指定测量级别),或者也可以使用“定义变量属性”对话框为每个字段建议适当的测量级别(有关详细信息,请参见指定测量级别)。
具有未知测量级别的字段
当数据集中的一个或多个变量(字段)的测量级别未知时,将显示测量级别警告。由于测量级别会影响该过程的计算结果,因此所有变量必须都定义有测量级别。
扫描数据。 读取活动数据集中的数据,并分配缺省测量级别给任何具有当前未知测量级别的字段。如果数据集较大,该过程可能需要一些时间。
手动分配。 打开列出了所有具有未知测量级别的字段的对话框。您可以使用该对话框将测量级别分配给这些字段。您也可以在数据编辑器的变量视图中分配测量级别。
由于测量级别对该过程很重要,因此您无法访问运行该过程的对话框,除非所有字段均定义了测量级别。
获取聚类分析
此功能在 SPSS Statistics Premium Edition 或“直销”选项中可用。
从菜单中选择:
- 选择将我的联系人分段到聚类。
- 选择要用于创建段的分类(名义、有序)字段和连续(刻度)字段。(有关测量级别的更多信息,请参见“数据”部分。)
- 单击运行以运行该过程。