寿命表
在多数情况下,您都会希望考察两个事件之间的时间分布,比如雇用时长(员工从雇用到离开公司的时间)。但是,这类数据通常包含没有记录其第二次事件的个案(例如,在调查结束后仍然为公司工作的员工)。出现这种情况有多种原因:对于某些个案,事件在研究结束前没有发生;而对于另一些个案,我们在研究结束前的某段时间未能跟踪其状态;还有一些个案可能因一些与研究无关的原因(例如员工生病或请假)无法继续。这些个案总称为已审查的个案,它们使得此类研究不适合 t 检验或线性回归等传统方法。
用于此类数据的统计方法称为跟进寿命表。寿命表的基本概念是将观察区间划分为较小的时间区间。对于每个区间,使用所有观察至少该时长的人员计算该区间内发生终端事件的概率。然后使用从每个区间估计的概率估计在不同时间点发生该事件的整体概率。
示例。 新尼古丁贴片疗法是否比传统贴片疗法更有助于戒烟?您可以对两组吸烟者进行调查,一组接受传统疗法,另一组接受实验性疗法。从数据构造寿命表将允许您比较两组的整体戒烟率,以确定实验性疗法是否是传统疗法的改进。还可以用图来表示生存或风险函数并对其进行直观比较,以获得更详细的信息。
统计。 每组在每个时间区间的期初记入数、期末离开数、历险数、终端事件数、终结比例、生存比例、累积生存比例(和标准误差)、概率密度(和标准误差)以及风险率(和标准误差);每组的中位数生存时间;用于比较两组间生存分布的 Wilcoxon (Gehan) 检验。图:生存、对数生存、密度、风险率和 1 减生存的函数图。
寿命表数据比较
数据。 时间变量应是定量的。状态变量应是以整数编码的二分变量或分类变量,事件编码为单值或一段连续值范围。因子变量应是以整数编码的分类变量。
假设。 所关心事件的概率应只取决于初始事件之后的时间(假设绝对时间下的概率不变)。即,从不同时间开始研究的个案(比如,从不同时间开始接受治疗的患者)应有相似的行为。已审查的个案和未审查的个案之间也不应存在系统性差别。例如,如果许多已审查的个案都是情况更为严重的患者,则得到的结果可能会存在偏差。
相关过程。 “寿命表”过程对此类分析(通常称为“生存分析”)使用保险精算方法。“Kaplan-Meier 生存分析”过程使用略有不同的方法计算寿命表,此方法不依赖于将观察期划分为较小的时间区间。如果您的观察值数量较少,建议使用此方法,这样每个生存时间区间内将只有较少数量的观察值。如果您怀疑变量与要控制的生存时间或变量(协变量)相关,则应使用“Cox 回归”过程。如果同一个个案中协变量在不同的时间点可以具有不同的值,则应使用带有“依时协变量”的“Cox 回归”。
创建寿命表
此功能需要“高级回归”选项。
- 从菜单中选择:
- 选择一个数值生存变量。
- 指定要检查的时间区间。
- 选择一个状态变量定义已发生终端事件的个案。
- 单击定义事件指定用于指示事件发生的状态变量的值。
或者,可以选择一阶因子变量。会为因子变量的每个类别生成生存变量的保险精算表。
还可以选择二阶按因子变量。会为一阶和二阶因子变量的每个组合生成生存变量的保险精算表。
此过程将粘贴 SURVIVAL 命令语法。