概率论与数理统计课程设计.docx
《概率论与数理统计课程设计.docx》由会员分享,可在线阅读,更多相关《概率论与数理统计课程设计.docx(12页珍藏版)》请在冰豆网上搜索。
概率论与数理统计课程设计
概率论课程设计
1110410327苏浪
国内产值与人力资本的回归分析
一、设计目的
二、设计问题
三、设计原理
四、设计程序
设计步骤
设计结果
1、得到回归分析结果:
2、建立回归模型对结果进行检验
五、设计总结
六、参考文献
一、设计目的
为了更好的了解概率论与数理统计的知识,熟练掌握概率论与数理统计在实际问题上的应用,并将所学的知识结合Excel对数据的处理解决实际问题。
本设计是利用一元线性回归理论对国内产值与人力资本关系建立数学模型,并用Excel分析工具库中的回归分析软件进行解算并检验。
二、设计问题
改革开放以来我国经济高速增长。
国内生产总值与诸多因素有关,为了解影响生产总值的因素,现查得1995-2005年各季度的国内生产总值和人力资本的数据如下,试确定国内生产值和人力资本的关系并检验。
年份季度
人力资本(X)
国内产值(Y)
年份季度
人力资本(X)
国内产值(Y)
1995春
324.0
14410.3
2000秋
618.9
24463.5
1995夏
325.0
14660.5
2000冬
640.7
24803.7
1995秋
348.6
15021.0
2001春
656.2
25621.5
1995冬
352.9
15198.5
2001夏
683.9
26428.8
1996春
373.6
15679.1
2001秋
710.5
27011.0
1996夏
391.1
16478.7
2001冬
764.3
27413.8
1996秋
400.6
17185.9
2002春
788.7
27887.0
1996冬
417.9
17794.2
2002夏
815.4
29186.3
1997春
423.9
18262.3
2002秋
838.7
29885.5
1997夏
441.2
18761.3
2002冬
872.9
30083.2
1997秋
456.4
19188.0
2003春
886.6
31605.4
1997冬
465.6
19743.3
2003夏
921.1
32363.1
1998春
473.5
20036.4
2003秋
941.4
33121.0
1998夏
488.4
20365.5
2003冬
962.7
33955.7
1998秋
498.9
20610.9
2004春
1001.4
34878.4
1998冬
508.1
21100.6
2004夏
1038.5
36710.4
1999春
521.6
21513.5
2004秋
1076.7
38121.5
1999夏
541.0
21885.5
2004冬
1116.5
39969.6
1999秋
554.2
22064.0
2005春
1153.9
41353.3
1999冬
571.8
22419.3
2005夏
1195.7
43564.0
2000春
585.4
23118.8
2005秋
1233.6
44882.8
2000夏
598.8
23854.0
2005冬
1290.4
45580.2
三、设计原理
本题是一道确定生产总值和人力资本的关系问题,首先做出该组数据的散点图,由图分析该数据属于线性回归问题,可以利用Excel解决这种类型的问题。
数据的处理时通过使用“最小二乘法”做直线拟合,然后再进行一元线性回归。
在整个过程中直接使用Excel进行数据处理,用matlab求F临界值,得出结论,然后根据Excle输出结果进行线性回归方差分析和相关系数的显著性检验。
四、设计程序
为了研究这些数据中所蕴含的规律,将生产总值看做因变量,人力资本看做自变量,画出它们的散点图(图1),可见这些点分布在一条直线附近,所以两组分的百分比之间可能符合一元线性模型。
下面用Excel“分析工具库”提供的“回归”工具,找出线性回归方程,并检验其显著性。
设计步骤
一、
在【工具】菜单中选中【数据分析】,则会弹出【数据分析】对话框,然后在“分析工具”中选择“回归”选项,如图二所示。
单击【确定】后,则弹出【回归】对话框,如图2所示。
二、
填写【回归】对话框。
如图2所示,该对话框的内容较多,可以根据需要,选择相关项目。
在“Y值输入区域”内输入队因变量数据区域的引用,该区域必须有单列数据组成,如本题中生产总值;在“X只输入区域”输入对自变量数据区域的引用,如本题中人力资本。
“标志”:
如果输入区域的第一行中包含标志项,则选中此复选框,本题中的输入区域包含标志项;如果在输入区域中没有标志项,则应清楚此复选框,Excel将在输出表中生成合适的数据标志。
“置信度”:
如果需要在汇总输出表中包含附件的置信度信息,则选中此复选框,然后在右侧的编辑框中,输入所要使用的置信度。
置信度为99%,相当于显著性水平a=0.01。
“常数为零”:
如果要强制回归线通过原点,则选中此复选框。
“输出选项”:
选择“输出区域”,在此输出对输出表左上角单元格的引用。
“残差”:
如果需要以残差输出表形式查看残差,则选中此复选框。
“标准残差”:
如果需要在残差输出表中包含标准残差,则选中此复选框。
“残差图”:
如果需要生成一张图表,绘制每个自变量及其残差,则选中此复选框。
“线性拟合图”:
如果需要为预测值和观察值生成和观测值生车一个图表,则选中此复选框。
“正态概率图”:
如果需要绘制正态概率图,则选中此复选框。
设计结果
1、得到回归分析结果:
a=4569.701813,b=31.29044388,相关系数R=0.99645818
测定系数
,F值:
F=5897.674
,t值:
t=76.79631637,标准离差(标准误差):
s=745.0012582,回归平方和:
SSr=3273367683,剩余平方和:
SSe=23311128.74;y的误差平方和即总平方和:
SSt=3296678812(见图3)
线性回归方程为:
回归直线图形为:
图4
参插图:
图5
2、建立回归模型对结果进行检验
模型为:
4569.701813+31.29044388x;
法一:
R=0.99645818>
法二:
在matlab中求出
命令如下
>>finv(0.99,1,42)
ans=
7.2796
即
7.2796
方差来源
平方和
自由度
F值
临界值
显著性
回归
剩余
3273367683
23311128.74
1
42
5897.674
7.2796
**
总计
3296678812
43
F=5897.674>
7.2796
所以认为线性相关性显著
综上所述:
国内产值和人力资本存在线性相关性,满足回归方程
,且线性相关性显著
图1
图2
SUMMARYOUTPUT
回归统计
MultipleR
0.99645818
RSquare
0.992928905
AdjustedRSquare
0.992760546
标准误差
745.0012582
观测值
44
方差分析
df
SS
MS
F
回归分析
1
3273367683
3.3E+09
5897.67421
残差
42
23311128.74
555027
总计
43
3296678812
Coefficients
标准误差
tStat
P-value
Intercept
4569.701813
301.9721376
15.1329
1.313E-18
人力资本(X)
31.29044388
0.407447198
76.7963
8.4805E-47
RESIDUALOUTPUT
观测值
预测国内产值(Y)
残差
1
14707.80563
-297.5556309
2
14739.09607
-78.59607476
3
15477.55055
-456.5505504
4
15611.3172
-412.867198
5
16259.81165
-580.6866474
6
16808.17668
-329.5016765
7
17103.87137
81.97862887
8
17645.97831
148.1716886
9
17832.15645
430.0935475
10
18373.48113
387.7688684
11
18849.09588
338.9041214
12
19139.31475
603.9352543
13
19386.50925
649.8907477
14
19850.39008
515.1099171
15
20181.28653
429.5634731
16
20468.37635
632.1986505
17
20890.01508
623.4849192
18
21498.61421
386.9107857
19
21910.08355
153.9164486
20
22460.79536
-41.54536372
21
22886.3454
232.4045995
22
23306.41961
547.5803904
23
23934.57527
528.9247294
24
24615.92469
187.7253139
25
25103.27335
518.2266505
26
25967.67186
461.0781382
27
26799.99767
211.002331
28
28484.20581
-1070.405811
29
29246.91038
-1359.910381
30
30084.71202
-898.4620155
31
30812.9971
-927.4970969
32
31882.34802
-1799.173017
33
32312.59162
-707.2166199
34
33389.76515
-1026.640151
35
34024.96116
-903.9611614
36
34691.44762
-735.7726161
37
35902.38779
-1024.012794
38
37063.26326
-352.9132623
39
38259.34048
-137.8404797
40
39503.91789
465.6571149
41
40675.74501
677.5049915
42
41982.12104
1581.878959
43
43170.37565
1712.374353
44
44945.32608
634.8239238
图3
图4
图5
五、设计总结
通过对概率论与数理统计的这道实际问题的解决,不仅使我更加深刻的理解了概率论与数理统计的基础知识,对一元线性回归及线性回归的方差分析、相关系数的显著性检验有了更深刻的了解,而且使我对这些知识在实际中的应用产生了浓厚的兴趣,同时对我学习好概率论与数理统计这门课有很大帮助。
在实现这道题的过程中我应用了Excel软件和matlab软件,学会了这两个软件的一些新的应用,更加熟练的操作该软件进行一些数据上的处理。
六、参考文献
[1]沈恒范.概率论与数理统计教程[M].第四版.北京:
高等教育出版社,2003.4:
140-196
[2]陈家鼎,孙山泽.数理统计讲义[M].高等教育出版社,1993:
37-52
[3]廖仲春.概率统计课程教学方法探索[J].大学时代(B版),2006,(01):
[4]杜世平.对区间估计与假设检验关系的思考[J].西南名族大学大学报(自然科学版),2005,31(03)
[5]蔡季冰,宋海龄,陈永.小样本参数估计算法及其应用[J].北京理工大学学报,1989,9
(1):
92-98