网站添加文章网站免费做app
SAS逐步回归法(Stepwise Regression)是一种变量选择技术,通过迭代添加或剔除预测变量,构建最优线性回归模型。其目标是在保持模型简洁性的同时最大化解释力,适用于高维数据或变量相关性较强的情景。
目录
【示例】
SAS代码
逐步选择过程
逐步选择汇总
y的拟合诊断
y的回归变量值-残差值
【示例】
Y与有相关关系,考虑回归模型,用逐步回归法求“最优”回归方程,观测数据如下:

使用SAS中的REG过程来完成逐步回归计算,假设引入变量的显著性水平为0.10,剔除变量的显著性水平为0.10
SAS代码
data d1;input x1-x4 y ;cards;
7  26  6 60  78.5
1  29 15 52  74.3
11 56  8 20 104.3
11 31  8 47  87.6
7  52  6 33  95.9
11 55  9 22 109.2
3  71 17  6 102.7
1  31 22 44  72.5
2  54 18 22  93.1
21 47  4 26 115.9
1  40 23 34  83.8
11 66  9 12 113.3
10 68  8 12 109.4
;proc reg data=d1;model y=x1-x4/selection=stepwisesle=0.10 sls=0.10; 
run;
quit; 
 
 
逐步选择过程
计算各情况R方值

引入一个最优变量

继续引入最优变量

继续引入最优变量
 
可以发现引入新变量后原变量x4变得不再重要,故第四步剔除x4

得到最优回归模型:
Y与x1,x2的二元回归模型的决定系数
逐步选择汇总
y的拟合诊断

y的回归变量值-残差值


