统计分析实验报告记录.docx

资源描述

统计分析实验报告记录.docx

《统计分析实验报告记录.docx》由会员分享，可在线阅读，更多相关《统计分析实验报告记录.docx（20页珍藏版）》请在冰豆网上搜索。

统计分析实验报告记录.docx

统计分析实验报告记录

————————————————————————————————作者：

————————————————————————————————日期：

统计分析综合

实验报告

学院：

专业：

姓名：

学号：

统计分析综合实验考题

一．样本数据特征分析：

要求收集国家统计局2011年全国人口普查与2000年全国人口普查相关数据，进行二者的比较，然后写出有说明解释的数据统计分析报告，具体要求如下：

1．报告必须包含所收集的公开数据表，至少包括总人口，流动人口，城乡、性别、年龄、民族构成，教育程度，家庭户人口八大指标；

2．报告中必须有针对某些指标的条形图，饼图，直方图，茎叶图以及累计频率条形图；（注：

不同图形针对不同的指标）

3．采用适当方式检验二次调查得到的人口年龄比例以及教育程度这两个指标是否有显著不同，写明检验过程及结论。

4．报告文字通顺，通过数据说明问题，重点突出。

二．线性回归模型分析：

自选某个实际问题通过建立线性回归模型进行研究，要求：

1.自行搜集问题所需的相关数据并且建立线性回归模型；

2.通过SPSS软件进行回归系数的计算和模型检验；

3.如果回归模型通过检验，对回归系数以及模型的意义进行解释并且作出散点图

一、样本数据特征分析

2010年全国人口普查与2000年全国人口普查相关数据分析报告

2000年与2011年全国人口普查各项指标原始数据单位（人）

年份

2000年

2011年

总人口数

1265825048

1370536875

家庭户人口数

1178271219

1244608395

流动人口数

42418562

261386075

城乡构成

农村居民人口数

783841243

674149546

城镇居民人口数

458770983

665575306

性别构成

男性人口数

640275969

686852572

女性人口数

602336257

652872280

年龄构成

0-14周岁人口数

284527594

222459737

15-59周岁人口数

828106762

939616410

60周岁及以上人口数

129977870

177648705

民族构成

汉族人口数

1137386112

1225932641

少数民族人口数

105226114

113792211

教育程度

大学（大专及以上）文化程度人口数

44020145

119636790

高中（含中专）文化程度人口数

138283459

187985979

初中文化程度人口数

422386607

519656445

小学文化程度人口数

441613351

358764003

文盲（15岁及以上不识字）人口数

85069667

54656573

（一）总人口

2011年第六次全国人口普查数据显示，总人口数为1370536875，比2000年的第五次人口普查的1265825048人次，总人口数增加73899804人，增长5.84%，平均年增长率为0.57%。

2000年和2011年两次人口普查各省份人口数据如下：

地区

2000年人口普查

2011年人口普查

北京市

13569194

19612368

天津市

9848731

12938224

河北省

66684419

71854202

山西省

32471242

35712111

内蒙古自治区

23323347

24706321

辽宁省

41824412

43746323

吉林省

26802191

27462297

黑龙江省

36237576

38312224

上海市

16407734

23019148

江苏省

73043577

78659903

浙江省

45930651

54426891

安徽省

58999948

59500510

福建省

34097947

36894216

江西省

40397598

44567475

山东省

89971789

95793065

河南省

91236854

94023567

湖北省

59508870

57237740

湖南省

63274173

65683722

广东省

85225007

104303132

广西壮族自治区

43854538

46026629

海南省

7559035

8671518

重庆市

30512763

28846170

四川省

82348296

80418200

贵州省

35247695

34746468

云南省

42360089

45966239

西藏自治区

2616329

3002166

陕西省

35365072

37327378

甘肃省

25124282

25575254

青海省

4822963

5626722

宁夏回族自治区

5486393

6301350

新疆维吾尔自治区

18459511

21813334

全国合计

1242612226

1339724852

做茎叶图分析：

表1-1：

案例处理摘要

年份

案例

有效

缺失

合计

百分比

人口数量

2000年

100.0%

0.0%

100.0%

2011年

100.0%

0.0%

100.0%

表1-2

描述

年份

统计量

标准误

人口数量

2000年

均值

40084265.35

4698126.750

均值的95%置信区间

下限

30489410.50

上限

49679120.21

5%修整均值

39305445.50

中值

35365072.00

方差

684244243725744.400

标准差

26158062.691

极小值

2616329

极大值

91236854

范围

88620525

四分位距

41049359

偏度

.503

.421

峰度

-.652

.821

2011年

均值

42992737.65

4963014.104

均值的95%置信区间

下限

32856910.64

上限

53128564.65

5%修整均值

41924325.67

中值

37327378.00

方差

763576778787588.500

标准差

27632893.059

极小值

3002166

极大值

104303132

范围

101300966

四分位距

36481362

偏度

.625

.421

峰度

-.332

.821

茎叶图

箱形图：

（二）流动人口

2011年人口普查数据中，居住地与户口登记地所在的乡镇街道不一致且离开户口登记地半年以上的人口为261386075人，同2000年第五次全国人口普查相比，居住地与户口登记地所在的乡镇街道不一致且离开户口登记地半年以上的人口增加116995327人，增长81.03%。

（三）城乡构成

2011年人口普查显示居住在城镇的人口为665575306人，占49.68%；居住在乡村的人口为674149546人，占50.32%。

2000年农村居民人口数为783841243人，占63.08%；城镇居民则有458770983人，占36.92%。

同2000年第五次全国人口普查相比，城镇人口增加207137093人，乡村人口减少133237289人，城镇人口比重上升13.46个百分点。

通过下面的条形图可以清楚的看到2000年—2011年十年间，农村居民减少而城镇居民增加。

（四）性别构成

2000年第五次人口普查男性人口为640275969人占51.53%；女性人口为602336257人，占48.47%。

2011年第六次人口普查显示男性人口为686852572人，占51.27%；女性人口为652872280人，占48.73%。

通过下面的饼图可以放大百分比上些微的变化（两个年份左边较小的部分均为女性人口数），总人口性别比（以女性为100，男性对女性的比例）由2000年第五次全国人口普查的106.74下降为105.20。

（五）年龄构成

2000年人口普查：

0-14岁人口为284527594人，占22.90%；15-59岁人口为828106762人，占66.64%；60岁及以上人口为129977870人，占10.46%。

2011年人口普查：

0-14岁人口为222459737人，占16.60%；15-59岁人口为939616410人，占70.14%；60岁及以上人口为177648705人，占13.26%。

同2000年第五次全国人口普查相比，0-14岁人口的比重下降6.29个百分点，15-59岁人口的比重上升3.36个百分点，60岁及以上人口的比重上升2.93个百分点，65岁及以上人口的比重上升1.91个百分点。

为了进一步分析各年龄段，根据联合国卫生组织的新划分标准将年龄进一步细分，用直方图进行分析。

原始数据整理如下：

两次人口普查年龄数据单位（人）

年龄段

2000年

2011年

少儿（0~14岁）

284527594

221322621

青年（15~44岁）

632911142

668233610

中年（45~59岁）

195195620

265660198

年轻老年人（60~74岁）

102058457

132752961

老年人（75~89岁）

26948186

42857259

长寿老人（90岁及以上）

971227

1984220

利用SPSS软件将六个年龄段分别赋值，1=“少年”，2=“青年”，3=“中年”，4=“年轻老年人”，5=“老年人”，6=“长寿老人”。

然后将描述统计量以1300万为一单位分为个体数据，通过直方图显示其分布频数。

通过直方图的分布可以得出，两次统计结果显示了相似的正态分布。

青年人口数量占有绝对较高的比例。

具体看到各个年龄段的人口变化（为了方便陈述，以数值代指各年龄段），年龄段1有较明显的人口数量减少，年龄段2、3、4、5在其原有基础上缓慢增长，年龄段3取代年龄段1变为人口数第二的年龄段。

由于年龄段6人口数始终较少，在处理数据过程中其特征无法被放大，2000年年龄段6的频数为0.242，2011年增长到0.496，其增长比例是最为显著的，说明随着社会经济的发展高龄老年人数量逐渐增多。

（六）民族构成

2000年普查，汉族人口为1137386112人，占91.53%；少数民族人口为105226114人，占8.47%。

2011年普查，汉族人口为1225932641人，占91.51%；各少数民族人口为113792211人，占8.49%。

同2000年第五次全国人口普查相比，汉族人口增加66537177人，增长5.74%；各少数民族人口增加7362627人，增长6.92%。

（七）教育程度

2000年人口普查时，具有大学（大专及以上）文化程度的人口为44020145人；具有高中（含中专）文化程度的人口为138283459人；具有初中文化程度的人口为422386607人；具有小学文化程度的人口为441613351人，文盲人口（15岁及以上不识字的人）为85069667人。

2011年，具有大学（大专及以上）文化程度的人口为119636790人；具有高中（含中专）文化程度的人口为187985979人；具有初中文化程度的人口为519656445人；具有小学文化程度的人口为358764003人，文盲人口（15岁及以上不识字的人）为54656573人。

　　同2000年第五次全国人口普查相比，每10万人中具有大学文化程度的由3611人上升为8930人；具有高中文化程度的由11146人上升为14032人；具有初中文化程度的由33961人上升为38788人；具有小学文化程度的由35701人下降为26779人。

用累计频率条形图对教育程度进行进一步分析，类似于年龄构成的数据处理方法，以1000万为单位对各个文化段的人口数进行调整，得出具体的个体值，再利用SPSS软件分别作出两次普查教育程度的累计频率条形图。

从上图可以看到大学（大专及以上）文化程度的人口占比特别低。

累计高中以上文化程度为20%不到，累计初中以上文化程度为50%多，累计小学以上文化程度为90%左右。

通过简单的相减可以得出结论，占比最大的文化段应该在小学文化程度。

另外注意到小学文化程度过后的文盲，占比约有10%。

根据2011年人口普查的数据，首先，大学（大专文化及以上）程度人口有显著增长，接近翻倍。

其他文化程度（除文盲）也都有所增长，其中累计高中以上文化程度频率约为25%，累计初中以上文化程度频率约65%，累计小学以上文化程度频率约95%。

同样可以直观的了解到，占比最大的文化段由小学文化程度移至初中文化程度。

最后看到文盲所占比重，相比较十年前，削减了近二分之一。

总的来说，对比两次普查，可以很肯定的说十年间我国教育事业取得了较为显著的成绩，国民受教育水平有较大提升。

（八）家庭户人口

2000年人口普查家庭户人口数共有1178271219人，有家庭户340491197，平均每个家庭3.44人。

2011年增长到1244608395人，平均每个家庭户的人口为3.10人，比2000年减少0.34人。

（九）对两次普查人口年龄比例这一指标是否有显著不同的检验。

采用配对样本T检验，表1-3和表1-4给出了各自的的均值、标准差、均值标准误差以及两次数据的相关系数，可以看出前后两次统计并没有发生显著的变化。

根据表1-5配对样本T检验的最后结果（p＝0.588>0.05）显示：

第六次人口普查和第五次人口普查在人口年龄比例这一指标上没有显著差异。

表1-3：

两次人口普查三个年龄段（0—14岁，15—59岁，60岁及以上）的描述统计量

成对样本统计量

均值

标准差

均值的标准误

对1

第五次人口普查

414204075.33

366685123.532

211705754.779

第六次人口普查

446574950.67

427573873.867

246859891.175

表1-4：

两次人口普查三个年龄段（0—14岁，15—59岁，60岁及以上）数据的相关系数

成对样本相关系数