数理统计城镇居民生活质量080.docx

上传人:b****6 文档编号:4690026 上传时间:2022-12-07 格式:DOCX 页数:11 大小:216.43KB
下载 相关 举报
数理统计城镇居民生活质量080.docx_第1页
第1页 / 共11页
数理统计城镇居民生活质量080.docx_第2页
第2页 / 共11页
数理统计城镇居民生活质量080.docx_第3页
第3页 / 共11页
数理统计城镇居民生活质量080.docx_第4页
第4页 / 共11页
数理统计城镇居民生活质量080.docx_第5页
第5页 / 共11页
点击查看更多>>
下载资源
资源描述

数理统计城镇居民生活质量080.docx

《数理统计城镇居民生活质量080.docx》由会员分享,可在线阅读,更多相关《数理统计城镇居民生活质量080.docx(11页珍藏版)》请在冰豆网上搜索。

数理统计城镇居民生活质量080.docx

数理统计城镇居民生活质量080

研究生“数理统计”课程课外作业

 

姓名:

潘世强学号:

20110802096

学院:

光电工程学院专业:

仪器科学与技术

类别:

学术型研究生上课时间:

2011年秋

 

成绩:

一元线性回归及非参数检验在城镇居民生活质量评价中的应用

摘要:

城市是人类聚居活动最密集、最丰富的区域,到20世纪末,全球已有一半人口生活在城市,预计到2025年,世界人口的2/3将居住在城市。

因而,不断改善和提高城镇居民生活质量是当前任何一个国家、地区和城市所面临的重要挑战。

这就必然使得如何客观、科学地评估城镇居民生活质量成为一个非常重要而迫切的任务。

本文以城镇居民为对象,针对城镇居民家庭人均可支配收入与农村居民家庭人均纯收入之间是否存在显著差异、以及城镇居民平均每人全部年收入(元)与可支配收入(元)之间是否存在线性相关关系进行分析。

运用数理统计中一元线性回归及非参数检验的相关知识,结合matlab软件与EXCEL软件进行辅助分析,最终得到了对城镇居民生活质量的相关评价结果。

一、问题提出,问题分析

城市是人类聚居活动最密集、最丰富的区域,到20世纪末,全球已有一半人口生活在城市,预计到2025年,世界人口的2/3将居住在城市。

城市化在给人们带来丰裕的物质享受、便利的生活设施和高效率的信息交流的同时,也带来了许多困扰,诸如环境污染、交通拥挤、住房紧张、精神紧张等城镇居民生活品质恶化问题。

因而,不断改善和提高城镇居民生活质量是当前任何一个国家、地区和城市所面临的重要挑战。

这就必然使得如何客观、科学地评估城镇居民生活质量成为一个非常重要而迫切的任务。

对城镇居民生活质量的评价研究,是客观评价该地区全面实现小康和现代化的重要评价依据之一,可以为制定改善和提高城镇居民生活质量的对策提供资料,有助于确立“以人为本”的全面发展观。

对生活质量的研究也是一个社会发展的必然要求,经济落后时期,经济增长和满足人们的基本生活需求是社会发展的主要目标,当经济发展到一定程度,人们的基本生活需求得到满足后,社会发展目标就转向如何提高居民生活质量和促进人的全面发展上来。

综上所述,对城镇居民生活质量的研究,具有理论与实践的重要意义。

二、数据描述

本文以城镇居民为对象,针对城镇居民家庭人均可支配收入与农村居民家庭人均纯收入之间是否存在显著差异、以及城镇居民平均每人全部年收入(元)与可支配收入(元)之间是否存在线性相关关系进行分析。

下面两个表格分别列出了近年来城乡居民家庭人均收入及恩格尔系数、2009年按收入等级分城镇居民家庭基本情况的统计数据(数据来源于中华人民共和国国家统计局的《中国统计年鉴》,相关网址

表1城乡居民家庭人均收入及恩格尔系数调查表

10-2城乡居民家庭人均收入及恩格尔系数

年份

城镇居民家庭人均可支配收入

农村居民家庭人均纯收入

绝对数(元)

指数

绝对数(元)

指数

1991

1700.6

212.4

708.6

317.4

1993

2577.4

255.1

921.6

346.9

1995

4283

290.3

1577.7

383.6

1997

5160.3

311.9

2090.1

437.3

1999

5854

360.6

2210.3

473.5

2001

6859.6

416.3

2366.4

503.7

2003

8472.2

514.6

2622.2

550.6

2005

10493

607.4

3254.9

624.5

2008

15780.8

815.7

4760.6

793.2

2009

17174.7

895.4

5153.2

860.6

 

表2按收入等级分城镇居民家庭基本情况调查表

三、模型建立

正如数据描述中所简述的,本文针对两个问题进行分析与建模:

一是针对城镇居民家庭人均可支配收入与农村居民家庭人均纯收入之间是否存在显著差异进行假设检验;二是针对城镇居民平均每人全部年收入(元)与可支配收入(元)之间是否存在线性相关关系进行分析。

下面依次对其进行分析。

<一>针对城镇居民家庭人均可支配收入与农村居民家庭人均纯收入之间是否存在显著差异进行假设检验

(1)提出统计假设

设X、Y分别表示城镇、农村居民人均收入(单位:

元),

为它们的分布函数。

则统计假设为

(2)模型构建

将样本混合后按由小到大的顺序排列,由于研究中采集的两组数据样本容量m、n相等,均为10,因此运用秩和检验法进行分析。

首先,相关数据如下表所示。

表3城乡居民家庭人均收入及恩格尔系数调查表

城乡居民家庭人均收入及恩格尔系数

年份

城镇居民家庭人均可支配收入X

农村居民家庭人均纯收入Y

绝对数(元)

绝对数(元)

1991

1700.6

708.6

1993

2577.4

921.6

1995

4283

1577.7

1997

5160.3

2090.1

1999

5854

2210.3

2001

6859.6

2366.4

2003

8472.2

2622.2

2005

10493

3254.9

2008

15780.8

4760.6

2009

17174.7

5153.2

由于m=n,将

的混合样本中的秩相加,记其和为T。

选择拒绝域形式为

通过查表求出两个临界值

,最终判断出假设是否正确。

(3)模型求解及模型检验

通过统计分析,得到样本Y的秩和T为67。

由于m=n=10,所以在

时,拒绝域为

可见,落在拒绝域内,故拒绝原假设,认为两个总体分布存在明显差异,且城镇居民人均收入普遍高于农村。

<二>针对平均每人全部年收入(元)与可支配收入(元)之间线性相关性进行分析

(1)提出统计假设

原假设为平均每人全部年收入(元)与可支配收入(元)之间无线性相关关系;备择假设为为平均每人全部年收入(元)与可支配收入(元)之间有线性相关关系。

(2)模型构建

由表2可见相关的数据

表4按收入等级分城镇居民家庭基本情况调查表

设平均每人全部年收入为X(单位:

元),其可支配收入为Y(单位:

元)。

求可支配收入为Y对平均每人全部年收入为X的回归直线。

假定这组数据满足一元线性回归模型:

一元线性模型:

(3)型求解及模型检验

利用最小二乘估计方法求出模型如下:

计算基本数据,如下表:

表5基本数据表

平均每人全部年收入Xi(元)

平均每人可支配收入Yi(元)

Xi*Xi

Yi*Yi

Xi*Yi

5950.68

5253.23

35410592.46

27596425.43

31260290.7

4935.81

4197.58

24362220.36

17619677.86

20718457.34

8956.81

8162.07

80224445.38

66619386.68

73106110.2

12345.17

11243.55

152403222.3

126417416.6

138803536.2

16858.36

15399.92

284204301.9

23715736

259617395.3

23050.76

21017.95

531337536.6

441754222.2

484479721.1

31171.69

28386.47

971674257.5

805791679.1

88485243

51349.57

46826.05

2636778339

2192678959

2404497532

154618.85

140486.82

4716394916

3915635302

4297337286

由表得:

回归直线为:

①用F检验法检验:

拒绝域为:

,落在拒绝中,即平均每人全部年收入(元)与可支配收入(元)之间呈线性关系。

②用t检验法检验:

拒绝域为:

,显然落在拒绝域中,即平均每人全部年收入(元)与可支配收入(元)之间呈线性关系。

四、计算方法设计和计算机实现

为了了解统计分析的实际应用,本文采用了两种不同的统计分析软件进行问题的辅助分析。

其中,针对城镇居民家庭人均可支配收入与农村居民家庭人均纯收入之间是否存在显著差异进行的假设检验,就是利用Matlab软件进行编程实现的;而针对平均每人全部年收入(元)与可支配收入(元)之间线性相关性则是依附于EXCEL软件进行分析得到的。

(1)针对城镇居民家庭人均可支配收入与农村居民家庭人均纯收入之间是否存在显著差异进行的假设检验:

用Matlab软件编写的程序如下所示:

x=[1700.62577.44283.05160.35854.06859.68472.210493.013785.817174.7

708.6921.61577.72090.12210.32366.42622.23254.94140.45153.2];

[x_new,x_index]=sort(x);

[index_new,index_ind]=sort(x_index);

inde=zeros(10,2);

inde(:

1)=index_ind(1:

10,1);

inde(:

2)=index_ind(11:

end,1);

图1matlab软件编程示意图

运行该程序得到相应的秩,将其求和可得到秩和T。

之后再根据秩和的大小进行假设检验。

图2matlab软件运行结果示意图

(2)针对平均每人全部年收入(元)与可支配收入(元)之间线性相关性进行的分析:

用EXCEL进行制表,对数据进行计算分析,并利用软件绘制出如下所示的散点图,容易看出,从图中很明显可以看出二者具有线性相关关系。

根据推测进行相应的回归直线的建立以及显著性检验,最终得到相应结果。

图3EXCEL软件数据分析示意图

五、主要的结论或发现

通过对城镇居民家庭人均可支配收入与农村居民家庭人均纯收入之间是否存在显著差异以及城镇居民平均每人全部年收入(元)与可支配收入(元)之间是否存在线性相关关系进行的分析与假设检验,最终得到以下主要结论:

(1)针对城镇居民家庭人均可支配收入与农村居民家庭人均纯收入之间是否存在显著差异进行的假设检验:

通过统计分析,得到样本Y的秩和T为67。

由于m=n=10,所以在

时,拒绝域为

可见,落在拒绝域内,故拒绝原假设,认为两个总体分布存在明显差异,且城镇居民人均收入普遍高于农村。

(2)针对平均每人全部年收入(元)与可支配收入(元)之间线性相关性进行的分析:

分别用最小二乘法和EXCEL对数据进行回归分析,得出的回归方程基本一致,关系模型为:

可见,平均每人的年收入与可支配收入呈正比,而且由直线的系数可知,可支配收入所占比重很高,因此可知,城镇居民的生活水平质量相对较高,资金的可支配性好。

六、结果分析与检验

由于以上的内容中已经对结果进行了相对详细的分析与检验,在此仅进行简要的概括与总结:

(1)在对比城镇居民家庭人均可支配收入与农村居民家庭人均纯收入之间显著性差异时,采用的是非参数假设检验中的秩和检验法,运用matlab软件进行编程分析后,对结果进行检验,最终得出两个总体分布存在明显差异,且城镇居民人均收入普遍高于农村的结论。

(详细的检验过程见第三部分)

(2)在对平均每人全部年收入(元)与可支配收入(元)之间线性相关性进行的分析中,采用最小二乘法,运用EXCEL软件进行数据处理,散点图绘制等,分析可得:

平均每人的年收入与可支配收入呈正比,且线性相关关系显著。

对拟合直线进行分析可知,可支配收入所占比重很高,城镇居民的生活水平质量相对较高,资金的可支配性好。

参考资料

[1]杨虎,刘琼荪等.数理统计[M].北京:

高等教育出版社,2004

[2]赵丽娟,冯韶华.Excel在一元线性回归预测分析中的应用[J].JournalofHandanPolytechnicCollege,2006,19(4):

112-119.

[3]盛骤,谢式千等.概率论与数理统计[M].北京:

高等教育出版社,2001

[4]刘元江,缪经纬等.统计软件在试验设计中的应用[J].JournalofQingyuanPolytechnic.2011,(03)

附录

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高中教育 > 理化生

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1