统计分析实验报告Word格式.docx
《统计分析实验报告Word格式.docx》由会员分享,可在线阅读,更多相关《统计分析实验报告Word格式.docx(19页珍藏版)》请在冰豆网上搜索。
性别构成
男性人口数
9
2
女性人口数
7
年龄构成
0-14周岁人口数
4
15-59周岁人口数
60周岁及以上人口数
民族构成
汉族人口数
12
41
少数民族人口数
1
教育程度
大学(大专及以上)文化程度人口数
高中(含中专)文化程度人口数
初中文化程度人口数
小学文化程度人口数
文盲(15岁及以上不识字)人口数
(一)总人口
2011年第六次全国人口普查数据显示,总人口数为75,比2000年的第五次人口普查的48人次,总人口数增加人,增长%,平均年增长率为%。
2000年和2011年两次人口普查各省份人口数据如下:
地区
2000年人口普查
2011年人口普查
北京市
天津市
河北省
山西省
内蒙古自治区
辽宁省
吉林省
黑龙江省
上海市
江苏省
浙江省
安徽省
福建省
江西省
山东省
河南省
湖北省
湖南省
广东省
2
广西壮族自治区
海南省
8671518
重庆市
四川省
贵州省
云南省
西藏自治区
3002166
陕西省
甘肃省
青海省
5626722
宁夏回族自治区
6301350
新疆维吾尔自治区
全国合计
26
52
做茎叶图分析:
表1-1:
案例处理摘要
案例
有效
缺失
合计
N
百分比
人口数量
31
%
表1-2
描述
统计量
标准误
均值
.35
均值的95%置信区间
下限
.50
上限
.21
5%修整均值
中值
.00
方差
标准差
.691
极小值
极大值
范围
四分位距
偏度
.503
.421
峰度
.821
.65
.64
.67
.059
.625
茎叶图
箱形图:
(二)流动人口
2011年人口普查数据中,居住地与户口登记地所在的乡镇街道不一致且离开户口登记地半年以上的人口为5人,同2000年第五次全国人口普查相比,居住地与户口登记地所在的乡镇街道不一致且离开户口登记地半年以上的人口增加7人,增长%。
(三)城乡构成
2011年人口普查显示居住在城镇的人口为6人,占%;
居住在乡村的人口为6人,占%。
2000年农村居民人口数为3人,占%;
城镇居民则有3人,占%。
同2000年第五次全国人口普查相比,城镇人口增加3人,乡村人口减少9人,城镇人口比重上升个百分点。
通过下面的条形图可以清楚的看到2000年—2011年十年间,农村居民减少而城镇居民增加。
(四)性别构成
2000年第五次人口普查男性人口为9人占%;
女性人口为7人,占%。
2011年第六次人口普查显示男性人口为2人,占%;
女性人口为0人,占%。
通过下面的饼图可以放大百分比上些微的变化(两个年份左边较小的部分均为女性人口数),总人口性别比(以女性为100,男性对女性的比例)由2000年第五次全国人口普查的下降为。
(五)年龄构成
2000年人口普查:
0-14岁人口为4人,占%;
15-59岁人口为2人,占%;
60岁及以上人口为0人,占%。
2011年人口普查:
0-14岁人口为7人,占%;
15-59岁人口为0人,占%;
60岁及以上人口为5人,占%。
同2000年第五次全国人口普查相比,0-14岁人口的比重下降个百分点,15-59岁人口的比重上升个百分点,60岁及以上人口的比重上升个百分点,65岁及以上人口的比重上升个百分点。
为了进一步分析各年龄段,根据联合国卫生组织的新划分标准将年龄进一步细分,用直方图进行分析。
原始数据整理如下:
两次人口普查年龄数据单位(人)
年龄段
少儿(0~14岁)
青年(15~44岁)
中年(45~59岁)
8
年轻老年人(60~74岁)
老年人(75~89岁)
长寿老人(90岁及以上)
971227
利用SPSS软件将六个年龄段分别赋值,1=“少年”,2=“青年”,3=“中年”,4=“年轻老年人”,5=“老年人”,6=“长寿老人”。
然后将描述统计量以1300万为一单位分为个体数据,通过直方图显示其分布频数。
通过直方图的分布可以得出,两次统计结果显示了相似的正态分布。
青年人口数量占有绝对较高的比例。
具体看到各个年龄段的人口变化(为了方便陈述,以数值代指各年龄段),年龄段1有较明显的人口数量减少,年龄段2、3、4、5在其原有基础上缓慢增长,年龄段3取代年龄段1变为人口数第二的年龄段。
由于年龄段6人口数始终较少,在处理数据过程中其特征无法被放大,2000年年龄段6的频数为,2011年增长到,其增长比例是最为显著的,说明随着社会经济的发展高龄老年人数量逐渐增多。
(六)民族构成
2000年普查,汉族人口为12人,占%;
少数民族人口为4人,占%。
2011年普查,汉族人口为41人,占%;
各少数民族人口为1人,占%。
同2000年第五次全国人口普查相比,汉族人口增加人,增长%;
各少数民族人口增加人,增长%。
(七)教育程度
2000年人口普查时,具有大学(大专及以上)文化程度的人口为人;
具有高中(含中专)文化程度的人口为9人;
具有初中文化程度的人口为7人;
具有小学文化程度的人口为1人,文盲人口(15岁及以上不识字的人)为人。
2011年,具有大学(大专及以上)文化程度的人口为0人;
具有初中文化程度的人口为5人;
具有小学文化程度的人口为3人,文盲人口(15岁及以上不识字的人)为人。
同2000年第五次全国人口普查相比,每10万人中具有大学文化程度的由3611人上升为8930人;
具有高中文化程度的由11146人上升为14032人;
具有初中文化程度的由33961人上升为38788人;
具有小学文化程度的由35701人下降为26779人。
用累计频率条形图对教育程度进行进一步分析,类似于年龄构成的数据处理方法,以1000万为单位对各个文化段的人口数进行调整,得出具体的个体值,再利用SPSS软件分别作出两次普查教育程度的累计频率条形图。
从上图可以看到大学(大专及以上)文化程度的人口占比特别低。
累计高中以上文化程度为20%不到,累计初中以上文化程度为50%多,累计小学以上文化程度为90%左右。
通过简单的相减可以得出结论,占比最大的文化段应该在小学文化程度。
另外注意到小学文化程度过后的文盲,占比约有10%。
根据2011年人口普查的数据,首先,大学(大专文化及以上)程度人口有显著增长,接近翻倍。
其他文化程度(除文盲)也都有所增长,其中累计高中以上文化程度频率约为25%,累计初中以上文化程度频率约65%,累计小学以上文化程度频率约95%。
同样可以直观的了解到,占比最大的文化段由小学文化程度移至初中文化程度。
最后看到文盲所占比重,相比较十年前,削减了近二分之一。
总的来说,对比两次普查,可以很肯定的说十年间我国教育事业取得了较为显著的成绩,国民受教育水平有较大提升。
(八)家庭户人口
2000年人口普查家庭户人口数共有19人,有家庭户7,平均每个家庭人。
2011年增长到95人,平均每个家庭户的人口为人,比2000年减少人。
(九)对两次普查人口年龄比例这一指标是否有显著不同的检验。
采用配对样本T检验,表1-3和表1-4给出了各自的的均值、标准差、均值标准误差以及两次数据的相关系数,可以看出前后两次统计并没有发生显著的变化。
根据表1-5配对样本T检验的最后结果(p=>
)显示:
第六次人口普查和第五次人口普查在人口年龄比例这一指标上没有显著差异。
表1-3:
两次人口普查三个年龄段(0—14岁,15—59岁,60岁及以上)的描述统计量
成对样本统计量
均值的标准误
对1
第五次人口普查
第六次人口普查
表1-4:
两次人口普查三个年龄段(0—14岁,15—59岁,60岁及以上)数据的相关系数
成对样本相关系数
相关系数
Sig.
第五次人口普查&
第六次人口普查
.987
.102
表1-5:
配对样本T检验结果
成对样本检验
成对差分
t
df
Sig.(双侧)
差分95%置信区间
第五次人口普查–第六次人口普查
.55
.13
.588
(十)对两次普查人口教育程度这一指标是否有显著不同的检验。
采用配对样本T检验,表1-6和表1-7给出了各自的的均值、标准差、均值标准误差以及两次数据的相关系数,可以看出前后两次统计并没有发生显著的变化。
根据表1-8配对样本T检验的最后结果(p=>
第六次人口普查和第五次人口普查在教育程度这一指标上没有显著差异。
两次人口普查教育程度的描述统计量
表1-6:
.888
.040
表1-7:
.920
.027
表1-8:
.27
.19
.69
.555
二、一元线性回归分析
北京市1995-2015年城镇居民消费性支出与可支配收入的关系
1.问题背景:
随着中国经济的高速持续增长,人们生活水平日益提高,作为我国经济文化中心,且经济发展水平位居前列的首都北京,其城镇居民消费水平在这中国经济崛起的二十多年里亦是有着翻天覆地的变化。
希望研究北京市城镇居民消费性支出与可支配收入的变化趋势及相关关系,发现其之间的数量关系规律,对居民收入增加,提高居民生活水平的具有重要意义。
根据1995~2015年北京市城镇居民消费性支出与可支配收入的统计数据,建立一元线性回归模型,对其进行回归分析。
2.原始数据:
北京市1995~2015年城镇居民人均可支配收入与消费性支出单位:
元
可支配收入
消费支出
1995
5868
5020
1996
6886
5730
1997
7813
6532
1998
8472
6971
1999
9183
7499
2000
10350
8494
2001
11578
8923
2002
12464
10286
2003
13883
11124
2004
15638
12200
2005
17653
13244
2006
19978
14825
2007
21989
15330
2008
24725
16460
2009
26738
17893
2010
29073
19934
2011
32903
21984
2012
36469
24046
2013
40321
26275
2014
43910
28009
2015
52859
36642
3.数据分析
建立模型:
yi=α+βxi(yi是消费支出,xi是可支配收入)
(1)消费支出可支配收入相关系数
表2-1
相关性
Pearson相关性
.997**
显著性(双侧)
.000
21
**.在.01水平(双侧)上显著相关。
从表中可得到两变量之间的皮尔逊相关系数为,双尾检验概率p值尾<
,故变量之间显著相关。
(2)回归模型检验
消费支出与可支配收入的散点图
从图上可以直观地看出这两个变量之间存在线性相关关系。
消费支出可支配收入相关系数表
表2-2
模型汇总
模型
R
R方
调整R方
标准估计的误差
.997a
.994
.993
a.预测变量:
(常量),消费支出。
结果表明相关系数r=,判定系数R方为,调整R方为,回归估计的标准差S=,说明样本回归方程的代表性强。
表2-3(方差分析表)
Anovaa
平方和
均方
F
回归
.000b
残差
总计
20
a.因变量:
可支配收入
b.预测变量:
结果表明:
统计量F=,显著性概率值P<
。
说明自变量x与y之间确有线性回归关系。
表2-4(回归系数分析表)
系数a
非标准化系数
标准系数
B的%置信区间
B
标准误差
试用版
(常量)
.623
.011
.997
.600
.647
从表格中可以看出估计值及其检验结果,β0=,β1=,β1的检验统计量t=,显著性概率值P<
,说明β1与0有显著性差别,该回归方程有意义。
变量的回归系数为,即可支配收入每增加1元,消费支出就增加元。
回归方程为y=+。
4.分析结论及应用价值
通过上面的回归分析,并结合原始数据,可以得出结论:
一直以来,北京市城镇居民的消费支出与人均可支配收入是存在正向内在联系的,人均可支配收入与消费性支出存在较强的线性回归关系,通过可决系数R方检验和显著性检验,得出其之间的回归模型方程为:
y=+,由此可见,城镇居民人均可支配收入是消费性支出的关键所在,因此,可以通过提高城镇居民收入,调整支配格局来改观城镇居民人均消费性支出,从而刺激内需,促进消费,以此带动经济的发展。