权重估计

标准线性回归模型假设方差在待研究总体中是恒定的。如果不是这种情况(例如,在某个属性较高的个案显示的可变性比此属性较低的个案更多时),则使用普通最小平方法 (OLS) 的线性回归不再提供最佳模型估计。如果可以从另一个变量预测可变性差异,则“权重估计”过程可以使用加权最小平方 (WLS) 计算线性回归模型的系数,这样在确定回归系数时,将对更精确的观测值(即可变性小的观测值)赋予更高的权重。“权重估计”过程检验一系列权重转换,并指示给出最佳数据拟合的转换。

示例。通货膨胀和失业对股票价格变化有何影响?由于高股值股票通常比低股值股票表现出更大的可变性,因此普通最小二乘法不会得出最优估计。权重估计允许您在计算线性模型时考虑股价对股价变化可变性的影响。

统计。所检验的权重源变量的每个幂的对数似然估计值、复 RR 方、调整 R 方、WLS 模型的 ANOVA 表、未标准化和标准化参数估计值以及 WLS 模型的对数似然估计。

权重估计数据注意事项

数据。因变量和自变量必须是定量的。分类变量(例如宗教、专业或居住地)需要重新编码为二分类(哑元)变量或其他类型的对比变量。权重变量应为定量变量,并与因变量的可变性相关。

假设。对于自变量的每个值,因变量必须呈正态分布。因变量和每个自变量之间的关系应是线性的,且所有观测值应是独立的。因变量的方差对于自变量的不同级别可能不同,但是必须能够根据权重变量预测此差异。

相关过程。用“探索”过程可以将数据显示到屏幕上。“探索”提供了正态性和方差同质性检验,并提供了图形化显示。如果对于自变量的不同级别,因变量都显示出具有相等的方差,则可使用“线性回归”过程。如果您的数据违反了某个假设(例如正态性假设),则尝试转换它们。如果您的数据不线性相关,且转换也没有帮助,则使用“曲线估计”过程中的备用模型。如果因变量是二分变量(例如,指示特定的销售是否已完成或者某一商品是否有缺陷),则请使用“Logistic 回归”过程。如果因变量是已审查的变量(例如,外科手术之后的存活时间),则使用“定制表”和“高级统计”中提供的“寿命表”、“Kaplan-Meier”或“Cox 回归”。如果数据不独立(例如,如果您在若干条件下观察同一个人),那么使用“定制表”和“高级统计”中提供的“重复测量”过程。

获取权重估计分析

此功能需要SPSS® Statistics Standard Edition 或“回归”选项

  1. 从菜单中选择:

    分析 > 回归 > 权重估计...

  2. 选择一个因变量。
  3. 选择一个或多个自变量。
  4. 选择导致异方差性的变量作为权重变量。
    权重变量 (Weight Variable)
    以此变量取幂后的倒数对数据进行加权。为指定范围的每个幂值计算回归方程,且回归方程指示使对数似然函数最大的幂。
    幂范围 (Power Range)
    与权重变量结合使用以计算权重。将拟合多元回归方程,分别对应幂范围中的每个值。在“幂范围”文本框和“到”文本框中输入的值必须在 -6.5 和 7.5 之间,含 -6.5 和 7.5。幂的值范围为从低值到高值,增量由指定的值确定。幂范围中值的总数不能超过 150。

此过程将粘贴 WLS 命令语法。