逐步回归法计算的例子和结果.docx

资源描述

逐步回归法计算的例子和结果.docx

《逐步回归法计算的例子和结果.docx》由会员分享，可在线阅读，更多相关《逐步回归法计算的例子和结果.docx（31页珍藏版）》请在冰豆网上搜索。

逐步回归法计算的例子和结果.docx

逐步回归法计算的例子和结果

例１某种水泥在凝固时放出的热量

（卡/克）与水泥中下列四种化学成分有关:

的成分（%）,

的成分（%）。

　　所测定数据如表１所示,试建立

与

、

及

的线性回归模型。

表１

试验序号

78.5

74.3

104.3

87.6

95.9

109.2

102.7

72.5

93.1

115.9

83.8

113.3

109.4

　　注:

本例子引自中国科学院数学研究室数理统计组编,《回归分析方法》,科学出版社,1974年

　　本软件给出的回归分析有关的结果如下（与回归分析无关的内容未列出）:

指标　名称:

热量　　　　　　　　　单位:

卡/克

因素１名称:

3CaO.Al2O3含量　　　　单位:

因素２名称:

3CaO.SiO2含量　　　　单位:

因素３名称:

4CaO.Al2O3.Fe2O3含量　单位:

因素４名称:

2CaO.SiO2含量　　　　单位:

-------------------多元回归分析-------------------

回归分析采用逐步回归法,显著性水平α＝0.10

引入变量的临界值Ｆa＝3.280

剔除变量的临界值Ｆe＝3.280

拟建立回归方程:

ｙ=b（0）+b

（1）*Ｘ

（1）+b

（2）*Ｘ

（2）+b（3）*Ｘ（3）+b（4）*Ｘ（4）

第１步,引入变量:

各项的判别值（升序排列）:

Ｖx（3）＝0.286

Ｖx

（1）＝0.534

Ｖx

（2）＝0.666

Ｖx（4）＝0.675

未引入项中,第４项[Ｘ（4）]Ｖx值（≥0）的绝对值最大,

引入检验值Ｆa（4）＝22.80,引入临界值Ｆa＝3.280,

Ｆa（4）＞Ｆa,引入第４项,已引入项数＝１。

第２步,引入变量:

各项的判别值（升序排列）:

Ｖx（4）＝-0.675

Ｖx

（2）＝5.52e-3

Ｖx（3）＝0.261

Ｖx

（1）＝0.298

未引入项中,第１项[Ｘ

（1）]Ｖx值（≥0）的绝对值最大,

引入检验值Ｆa

（1）＝108.2,引入临界值Ｆa＝3.280,

Ｆa

（1）＞Ｆa,引入第１项,已引入项数＝２。

第３步,引入变量:

各项的判别值（升序排列）:

Ｖx（4）＝-0.439

Ｖx

（1）＝-0.298

Ｖx（3）＝8.81e-3

Ｖx

（2）＝9.86e-3

未引入项中,第２项[Ｘ

（2）]Ｖx值（≥0）的绝对值最大,

引入检验值Ｆa

（2）＝5.026,引入临界值Ｆa＝3.280,

Ｆa

（2）＞Ｆa,引入第２项,已引入项数＝３。

第４步,剔除或引入变量:

各项的判别值（升序排列）:

Ｖx

（1）＝-0.302

Ｖx

（2）＝-9.86e-3

Ｖx（4）＝-3.66e-3

Ｖx（3）＝4.02e-5

已引入项中,第４项[Ｘ（4）]Ｖx值（＜0）的绝对值最小,

未引入项中,第３项[Ｘ（3）]Ｖx值（≥0）的绝对值最大,

剔除检验值Ｆe（4）＝1.863,剔除临界值Ｆe＝3.280,

Ｆe（4）≤Ｆe,剔除第４项,已引入项数＝２。

第５步,剔除或引入变量:

各项的判别值（升序排列）:

Ｖx

（2）＝-0.445

Ｖx

（1）＝-0.312

Ｖx（3）＝3.61e-3

Ｖx（4）＝3.66e-3

已引入项中,第１项[Ｘ

（1）]Ｖx值（＜0）的绝对值最小,

未引入项中,第４项[Ｘ（4）]Ｖx值（≥0）的绝对值最大,

剔除检验值Ｆe

（1）＝146.5,剔除临界值Ｆe＝3.280,

Ｆe

（1）＞Ｆe,不能剔除第１项。

引入检验值Ｆa（4）＝1.863,引入临界值Ｆa＝3.280,

Ｆa（4）≤Ｆa,不能引入第４项,已引入项数＝２。

变量筛选结果:

检验项数＝４,预期引入项数＝３,实际引入项数＝２,实际引入项数≠预期引入项数

回归方程:

ｙ=b（0）+b

（1）*Ｘ

（1）+b

（2）*Ｘ

（2）

回归系数b（i）:

b（0）＝52.6

（1）＝1.47

（2）＝0.662

标准回归系数B（i）:

（1）＝0.574

（2）＝0.685

复相关系数Ｒ＝0.9893

决定系数Ｒ^2＝0.9787

修正的决定系数Ｒ^2a＝0.9767

变量分析:

　　　　　　　　　　　　　　　　　变量分析表

变异来源

平方和

自由度

均方

均方比

回归

Ｕ＝2.66e+3

Ｋ＝2

Ｕ/Ｋ＝1.33e+3

Ｆ＝229.5

剩余

Ｑ＝57.9

Ｎ－１－Ｋ＝10

Ｑ/（Ｎ－１－Ｋ）＝5.79

总和

Ｌ＝2.72e+3

Ｎ－１＝12

样本容量Ｎ＝13,显著性水平α＝0.10,检验值Ｆt＝229.5,临界值Ｆ（0.10,2,10）＝2.924

剩余标准差ｓ＝2.41

回归系数检验值:

ｔ检验值（df＝10）:

ｔ

（1）＝12.10

ｔ

（2）＝14.44

Ｆ检验值（df1＝1,df2＝10）:

Ｆ

（1）＝146.5

Ｆ

（2）＝208.6

偏回归平方和U（i）:

（1）＝848

（2）＝1.21e+3

偏相关系数ρ（i）:

ρ1,2＝0.9675

ρ2,1＝0.9769

各方程项对回归的贡献（按偏回归平方和降序排列）:

（2）＝1.21e+3,U

（2）/U＝45.4%

（1）＝848,U

（1）/U＝31.9%

残差分析:

　　　　　　　　　　　　　　　残差分析表

№

观测值

回归值

观测值－回归值

（回归值－观测值）/观测值×100（%）

１

78.5

80.1

-1.60

2.04

２

74.3

73.3

1.00

-1.35

３

104

106

-2.00

1.92

４

87.6

89.3

-1.70

1.94

５

95.9

97.3

-1.40

1.46

６

109

105

4.00

-3.67

７

103

104

-1.00

0.971

８

72.5

74.6

-2.10

2.90

９

93.1

91.3

1.80

-1.93

116

115

1.00

-0.862

83.8

80.5

3.30

-3.94

113

112

1.00

-0.885

109

112

-3.00

2.75

------------------回归分析结束------------------

　　逐步回归法计算得到的优化的回归方程为

在显著性水平为α＝0.10上显著。

双重筛选逐步回归法计算的例子和结果

例１为了分析某地区自然经济条件对森林覆盖面积消长的影响而抽取12个村作为样本,共测了12个因子,各因子数据列于表１。

表１

序号

74.3

91.0

5.76

1.3

108

17.4

51.2

9.5

15.39

12.6

70.4

157.0

8.04

2.2

126

17.2

52.5

24.2

10.84

8.4

78.7

77.0

7.94

2.0

114

17.0

62.9

22.8

13.57

9.8

78.9

67.0

6.86

1.5

110

17.0

64.3

25.1

34.57

14.0

49.1

91.0

4.92

1.5

16.5

39.3

10.7

7.41

5.6

57.6

219.0

5.56

2.5

16.8

37.3

9.12

2.8

53.1

221.0

7.42

3.9

16.8

30.0

27.0

8.64

2.8

70.1

123.0

5.38

3.1

123

17.0

47.8

34.6

81.64

11.2

86.6

45.0

12.54

1.2

105

14.8

69.0

37.3

23.95

11.2

82.2

81.0

13.24

1.6

131

15.9

62.3

16.5

33.60

16.8

76.8

90.0

10.70

1.5

131

15.8

67.6

22.2

8.93

9.8

88.9

83.0

1.98

1.8

107

14.5

79.3

42.1

58.97

3.5

其中:

山地比例（%）;

人口密度（人/

）;

人均收入增长率（元/年）;

公路密度（100m/ha）;

前汛期降水量（cm/年）;

后汛期降水量（cm/年）;

月平均最低温度（℃）;

森林覆盖率（%）;

针叶林比例（%）;

造林面积（千亩/年）;

年采伐面积（千亩/年）;

火灾频数（次/年）。

　　注:

本例子引自裴鑫德编著,《多元统计分析及其应用》,北京农业大学出版社,1990年

　　本软件给出的回归分析有关的结果如下（与回归分析无关的内容未列出）:

指标１名称:

森林覆盖率　　　　　　单位:

指标２名称:

针叶林比例　　　　　　单位:

指标３名称:

造林面积　　　　　　　单位:

万亩/年

指标４名称:

年采伐面积　　　　　　单位:

千亩/年

指标５名称:

火灾频数　　　　　　　单位:

次/年

因素１名称:

山地比例　　　　　　　单位:

因素２名称:

人口密度　　　　　　　单位:

人/平方公里

因素３名称:

人均收入增长率　　　　单位:

元/年

因素４名称:

公路密度　　　　　　　单位:

100米/公顷

因素５名称:

前汛期降水量　　　　　单位:

厘米/年

因素６名称:

后汛期降水量　　　　　单位:

厘米/年

因素７名称:

月平均最低温度　　　　单位:

℃

回归分析采用双重筛选逐步回归法,显著性水平α＝0.05

自变量引入、剔除的临界值Ｆx＝2.000

因变量引入、剔除的临界值Ｆy＝2.500

对指标1～5拟建立回归方程分别为:

ｙ1=b（0）+b

（1）*Ｘ

（1）+b

（2）*Ｘ