添加变量

“添加变量”将活动数据文件与另一个打开的数据文件或包含相同个案(行)但不同变量(列)的外部 IBM® SPSS Statistics 数据文件合并在一起。 例如,可能要将一个包含检验前结果的数据文件与包含检验后结果的数据文件合并。

“合并方法”选项卡

使用合并方法选项卡定义合并类型。

基于文件顺序一对一合并
文件中的个案顺序决定了个案的匹配方式。 这是两个文件中不存在具有相同名称和基本类型(字符串或数字)的变量时的缺省设置。 该设置以下列各式生成 MATCH FILES 命令语法(其中 [name] 是数据集或外部文件规范(以引号括起)):
MATCH FILES FILE=* /FILE="[name]"
基于键值一对一合并
基于一个或多个键变量的值匹配个案。 这是两个文件中存在具有相同名称和基本类型(字符串或数字)的一个或多个变量时的缺省设置。 该设置以下列各式生成 MATCH FILES 命令语法(其中 [name] 是数据集或外部文件规范(以引号括起)):
MATCH FILES FILE=* /FILE="[name]" /BY [key varlist]
基于键值一对多合并
一个文件包含个案数据,一个文件是查找表。 来自查找表的个案与个案数据文件中具有匹配键值的个案合并。 相同键值在个案数据文件中可以多次出现。 查找表中的一个个案可以与个案数据文件中的多个个案合并。
  • 个案数据文件中的所有个案都包含在合并文件中。
  • 如果查找表文件中的个案在个案数据文件中没有对应的具有匹配键值的个案,那么不包含此类个案。
  • 查找表文件不能包含重复的键值。 如果文件包含多个键变量,那么键值是这些值的组合。
该设置对查找表使用 TABLE 子命令来生成 MATCH FILES 语法。
选择查找表
仅当选择了基于键值一对多合并时,才会启用下列设置。
[活动数据集名称]*
活动数据集名称后跟星号。
  • 缺省情况下,不会选择该选项。 如果选中该选项,该设置以下列各式生成语法(其中 [name] 是数据集或外部文件规范(以引号括起)):
    MATCH FILES TABLE=* /FILE=”[name]” /BY [key varlist]
[第二个数据集名称或文件名]
第二个数据集或文件的名称。
  • 这是缺省设置。
  • 如果文件是外部文件,那么仅提供文件名(而不是整个路径),完整路径将包含在生成的语法中。
  • 如果第二个文件是外部文件(且选择了排序,或者它包含的字符串键要求更改定义的长度),那么必须先打开该文件,并为其分配唯一名称。
  • 如果第二个文件是需要打开的外部文件(基于前一个条件),且未命名活动数据集,那么必须先命名活动数据集,然后才能打开第二个数据文件。
  • 当打开第二个文件进行排序或更改字符串键长度时,在合并操作后仍保持打开状态。 由于文件已更改,因此在关闭文件时,将提示您保存更改。
  • 如果选中该选项,该设置以下列各式生成语法(其中 [name] 是数据集或外部文件规范(以引号括起)):
    MATCH FILES FILE=* /TABLE=”[name]” /BY [key varlist]
合并之前按键值对文件排序
对于键值合并,两个文件都必须按照键变量值排序。
  • 仅当选择了其中一个键值合并选项时,才会启用该设置。
  • 如果其中一个文件是外部文件,将打开此文件并进行排序。 除非显式保存文件,否则将不会保存已排序的文件。
  • 如果文件已经排序,可以取消选择该选项来节省时间。
  • 当选择该选项时,该设置会生成 SORT CASES 语法。
键变量
对于键值合并,缺省情况下,具有相同名称和基本数据类型(字符串或数字)的变量或作为键变量包含在内。 使用变量选项卡添加、移除或更改键变量的顺序。
注:
  • 所选合并始终生成 MATCH FILES 命令语法(从不生成 STAR JOIN 语法)。
  • SORT CASESALTER TYPE 命令语法优先于 MATCH FILES 命令语法。
  • 是否包含 DROP 子命令语法和可选的 RENAME 子命令语法取决于在变量选项卡上所做的选择。
  • 如果选择了其中一个键值合并选项,则会包括 BY 子命令语法。
  • 当字符串键具有不同的定义长度时,会自动生成 ALTER TYPE 语法来确保定义相同的长度。

“变量”选项卡

使用变量选项卡添加、移除和重命名变量以包含在合并后的文件中。

  • 活动数据文件中的变量使用星号 (*) 标识。
  • 其他数据文件中的变量使用加号 (+) 标识。
排除的变量
要从新合并的数据文件中排除的变量。
  • 当在合并方法选项卡上选择了基于文件顺序一对一合并设置时,第二个数据集中与活动数据集中的变量同名的变量将被排除。
  • 当在合并方法选项卡上选择了基于键值一对一合并基于键值一对多合并设置时,排除第二个数据集中所有重复名称变量(与活动数据集中相同变量名称具有不同基本类型(字符串/数字)的变量)。
包含的变量
要包含在新合并数据文件中的变量。 如果想要在合并后数据文件中包含有重复名称的已排除变量,请使用重命名来更改名称。
  • 当在合并方法选项卡上选择了基于文件顺序一对一合并设置时,将包含活动数据集中的所有变量和第二个数据集中所有唯一命名的变量。
  • 当在合并方法选项卡上选择了基于键值一对一合并基于键值一对多合并设置时,将包含两个数据集中所有唯一命名的变量。 对于活动数据集中在第二个数据集中具有重复名称但具有不同基本类型(字符串/数字)的变量,也会包含在内。
键变量
对于键值合并,基于键变量值合并个案。
  • 缺省列表分配由所选合并方法确定。 变量不会自动分配到键变量列表。
    • 当在合并方法选项卡上选择了基于文件顺序一对一合并设置时,不会包含变量,移动控件处于禁用状态,且手动拖放变量也无任何效果。
    • 当在合并方法选项卡上选择了基于键值一对一合并基于键值一对多合并设置时,将包含两个数据集中所有具有相同名称和相同基本类型(字符串/数字)的变量。
  • 每一个键变量在两个文件中都必须具有相同名称和相同基本数据类型(字符串/数字)。
  • 如果某个键变量在两个文件中具有不同的名称,使用重命名来更改其中一个名称。
  • 如果某字符串键变量在两个文件中具有不同的定义长度,具有较短长度的变量会自动调整为较长的长度。 除非显式保存原始文件的修改后版本,否则不会保存修改后文件。