体质指数和年龄对血压的回归分析.docx

上传人:b****5 文档编号:5917278 上传时间:2023-01-02 格式:DOCX 页数:11 大小:134.58KB
下载 相关 举报
体质指数和年龄对血压的回归分析.docx_第1页
第1页 / 共11页
体质指数和年龄对血压的回归分析.docx_第2页
第2页 / 共11页
体质指数和年龄对血压的回归分析.docx_第3页
第3页 / 共11页
体质指数和年龄对血压的回归分析.docx_第4页
第4页 / 共11页
体质指数和年龄对血压的回归分析.docx_第5页
第5页 / 共11页
点击查看更多>>
下载资源
资源描述

体质指数和年龄对血压的回归分析.docx

《体质指数和年龄对血压的回归分析.docx》由会员分享,可在线阅读,更多相关《体质指数和年龄对血压的回归分析.docx(11页珍藏版)》请在冰豆网上搜索。

体质指数和年龄对血压的回归分析.docx

体质指数和年龄对血压的回归分析

 

摘要

数理统计是具有广泛应用的数学分支,而回归分析问题在其中占有很重要的地位。

回归分析是数理统计中研究变量之间相关关系的一种有效方法。

在现实世界中,经常出现一些变量,它们相互联系,互相依存,因而它们之间存在着一定的关系。

一般说来变量之间的关系大致可分为两类:

一是确定性的关系,也就是我们所熟知的函数关系;另一类是非确定性关系,我们称为相关关系。

对于具有相关关系的变量,虽然不能找到它们之间的精确表达式,但是通过大量的试验(观测)数据,可以发现它们之间存在一定的统计规律性。

对于实际问题非确定性问题居多。

它主要分为一元和多元,也分为线性和非线性的回归分析。

本题是多元线性回归分析的问题,研究与血压相关的问题,确定随机变量与变量之间存在着的相关关系。

根据MATLAB软件绘出残差图,得出线性回归方程,置信区间与相关数据,从而进行一系列的回归,来估计一个人的血压,在实际中进而可以估计一类人的血压情况。

 

关键词:

回归分析;相关关系;多元线性回归;残差图;置信区

体质指数和年龄对血压的回归分析

1设计目的

为了更好的了解概率论与数理统计的知识,熟练掌握概率论与数理统计在实际问题上的应用,并将所学的知识结合MATLAB对数据的处理解决实际问题。

本设计是利用二元线性回归理论对血压问题建立数学模型,并用MATLAB分析工具库中的回归分析软件进行解算。

1.1设计问题

世界卫生组织推荐的“体质指数”BMI的定义为BMI=

其中W表示体重(单位:

kg),H表示身高(单位:

m),显然它比体重本身更能反映人的胖瘦,对30个人测量他(她)们的血压和体质指数,如图所示.

(1)建立血压对年龄和体质指数的二元线性回归方程:

(2)建立回归方程进行残差分析:

血压年龄和体质指数的数据

序号

血压/mmHg

年龄

体质指数

1

144

39

24.2

2

215

47

31.1

3

138

45

22.6

4

145

47

24.0

5

162

65

25.9

6

142

46

25.1

7

170

67

29.5

8

124

42

19.7

9

158

67

27.2

10

154

56

19.3

11

162

64

28.0

12

150

56

25.8

13

140

59

27.3

14

110

34

20.1

15

128

42

21.7

16

130

48

22.2

17

135

45

27.4

18

114

18

18.8

19

116

20

22.6

20

124

19

21.5

21

136

36

25.0

22

142

50

26.2

23

120

39

23.5

24

120

21

20.3

25

160

44

27.1

26

158

53

28.6

27

144

63

28.3

28

130

29

22.0

29

125

25

25.3

30

175

69

27.4

1.2问题分析

回归分析一般分为线性回归分析与非线性回归分析。

本题采用的是线性回归分析中的二元线性回归。

本设计是一道确定血压与年龄和体质指数关系问题,假设课题数据服从正态分布,先用MATLAB绘出残差图,经过一系列的剔除坏点,得到相对准确的数据,再由图分析该数据属于线性回归问题,在MATLAB软件中得出回归方程系数,置信区间与相关性检验所需的数据。

然后对其进行多元线性回归分析

2设计原理

二元线性回归分析模型及参数的确定。

二元线性回归分析预测法的回归方程为:

  

  式中:

x1,x2——自变量;

  

——因变量,即线性回归分析估值,或预测值;

  a,b1,b2——待定回归方程参数。

  最小二乘法建立的求参数的方程为:

  

  

  

只需将历史资料自变量2和对应的因变量—v的数据代人上面公式,并联立求解方程组,即可求得回归参数a,b1,b2

  再将这些参数代人回归方程,即可得预测模型。

3设计程序

为了研究这些数据中所蕴含的规律,将血压Y看做因变量,

,看做自变量,用MATLAB画出它们的残差图,可见存在异常点,剔除异常点,找出线性回归方程,假定Y与

有如下关系

3.1设计步骤

输入命令:

y=[144,215,138,145,162,142,170,124,158,154,162,150,140,110,128,130,135,114,116,124,136,142,120,120,160,158,144,130,125,175]

x1=[39,47,45,47,65,46,67,42,67,56,64,56,59,34,42,48,45,18,20,19,30,50,39,21,44,53,63,29,25,69]

x2=[24.2,31.1,22.6,24.0,25.9,25.1,29.5,19.7,27.2,19.3,28.0,25.8,27.3,20.1,21.7,22.2,27.4,18.8,22.6,21.5,25.0,26.2,23.5,20.3,27.1,28.6,28.3,22.0,25.3,27.4]

n=length(y);

x=[ones(n,1),x1',x2'];

[b,bint,r,rint,s]=regress(y',x);

b,bint,s

输出:

b=

30.6041

0.4643

3.6959

bint=

-10.511271.7194

0.02870.8999

1.66075.7311

s=

0.636523.64370.0000188.9546

rcoplot(r,rint)

其残差图为:

残差图1

从图中发现第2,第10个为异常点,剔除它重新计算并画图

y=[144,138,145,162,142,170,124,158,162,150,140,110,128,130,135,114,116,124,136,142,120,120,160,158,144,130,125,175]

x1=[39,45,47,65,46,67,42,67,64,56,59,34,42,48,45,18,20,19,30,50,39,21,44,53,63,29,25,69]

x2=[24.2,22.6,24.0,25.9,25.1,29.5,19.7,27.2,28.0,25.8,27.3,20.1,21.7,22.2,27.4,18.8,22.6,21.5,25.0,26.2,23.5,20.3,27.1,28.6,28.3,22.0,25.3,27.4]

n=length(y);

x=[ones(n,1),x1',x2'];

[b,bint,r,rint,s]=regress(y',x);

b,bint,s

b=

50.4197

0.5568

2.6138

bint=

17.986582.8529

0.23400.8796

0.91854.3091

s=

0.783945.35090.000072.3621

rcoplot(r,rint)其残差图为

残差图2

此时由图可知已无异常点,所以用这28组数据进行估计结果会比较准确。

回归系数

回归系数估计值

回归系数置信区间

b0

50.4197

[17.9865

82.8529]

b1

0.5568

[0.2340,0.8796]

b2

2.6138

[0.9185,4.3091]

依据上面的实验可得出Y关于x1,x2的方程:

y=50.4197+0.5568*x1+2.6138*x2.

利用excel插件

输入:

首先在excel中输入数据,在选择工具-数据分析-回归即可。

具体步骤如下:

图1数据分析工具界面

图2回归分析工具界面

输出:

表中,“MultipleR”是线性回归的系数“RSquare”是拟合系数“AdjustedRSquare”调整后的拟合系数。

 

表1回归统计

表2方差分析

表3回归分析结果

表5回归分析结果残差与标准残差

图为用EXCEL处理数据得出的残差分布图

3.2结果分析

Matlab的结果表明,参数的估计值

;b0的置信区间为

.b1的置信区间为

b2的置信区间为

;因为

故回归模型.

成立。

从残差效果图看出,除掉几个坏点数据外,其余数据的残差离零点都较近,且残差的置信区间均包含零点,

这说明回归模型能较好的拟合数据。

4设计总结

通过对概率论与数理统计的这道实际问题的解决,不仅使我更加深刻的理解了概率论与数理统计的基础知识,而且使我对这些知识在实际中的应用产生了浓厚的兴趣,同时对我学习好概率论与数理统计这门课有很大帮助。

在实现这道题的过程中我应用了Excel软件,学会了该软件的一些新的应用,更加熟练的操作该软件进行一些数据上的处理。

 

致谢

本论文是张玉春老师指导下完成的。

她严肃的科学态度,严谨的治学精神,精益求精的工作作风,深深地感染和激励着我。

在此,我向张老师致以诚挚的谢意和崇高的敬意。

同时我还要感谢我的同学们,在论文设计中,他们给了我很多的建议和帮助。

我还要感谢我的论文中被我引用或参考的文献的作者

 

参考文献

[1]沈恒范.概率论与数理统计教程[M].第四版.高等教育出版社,2003.4:

140-196

[2]MorrisH.DeGroot,MarkJ.Schervish[美].概率统计[M].叶中行,王蓉华,徐晓岭.第三版.人民邮电出版社,2007.3,175-333

[3]徐传胜.贝塔分布的有关性质及应用探讨[J].临沂师范学院学报,2001,23(4):

6-8

[4]陈家鼎,孙山泽.数理统计讲义[M].高等教育出版社,1993:

37-52

 

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 外语学习 > 其它语言学习

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1