统计学实验报告.docx
《统计学实验报告.docx》由会员分享,可在线阅读,更多相关《统计学实验报告.docx(18页珍藏版)》请在冰豆网上搜索。
![统计学实验报告.docx](https://file1.bdocx.com/fileroot1/2022-11/25/3bd242a4-321a-43f6-b9f7-e1067e607df4/3bd242a4-321a-43f6-b9f7-e1067e607df41.gif)
统计学实验报告
统计实验一:
数据的整理与显示
一、实验目的及要求
(一)目的
⑴掌握EXCEL用于数据预处理的基本菜单操作及命令;
⑵掌握EXCEL用于整理与显示的基本菜单操作及命令。
⑶能够根据实际中的数据特点选择最优的图形进行数据的展示。
(二)内容及要求
1.根据学生实验数据3.01中所提供的数据,制作一张频数分布表,绘制一张条形图。
2.根据数据进行适当的整理,编制报表。
。
3.6对重量数据进行整理,构建频数分布表,并绘制直方图,说明分布特征。
3.11根据题中所提供的数据,画出散点图。
3.12根据题中数据,画出两个班考试成绩的对比条形图和环形图,比较分布特点,绘制雷达图,比较两个班考试成绩的分布是否相似。
二、仪器用具
实验场所:
经管院实验室
硬件:
计算机(安装Windows98、Windows2000或WindowsXP或以上)
软件:
EXCEL
三、实验原理
应用EXCEL的基本原理,根据不同数据的特征选择合适的数据处理方法对数据进行基本的整理和图形的展示。
四、实验方法与步骤
⑴数据的EXCEL预处理
①利用EXCEL进行筛选
“数据”——“筛选”——“自动筛选/高级筛选”
②利用EXCEL进行排序
“数据”——“排序”
⑵品质数据的EXCEL整理和显示
“插入”——“图表”——选择图形
⑶数值型数据的EXCEL整理和显示
“工具”——“数据分析”——“直方图”
五、实验结果与数据处理
1、
(1)属于顺序型数据
(2)
计数项:
等级
选项
汇总
A
14
B
21
C
32
D
18
E
15
总计
100
(3)
质量等级分布条形图
2、
一个国家销售人员每季度获得订单情况
国家/地区
销售人员
季度1
季度2
季度3
季度4
英国
Buchanan
3237,12
6647,67
12975,8
8572,57
英国
King
15108,34
16437,92
20263,93
8017
英国
Suyama
5583,16
14245,21
5481,65
15516,35
英国
Dodsworth
1310,8
5692,28
5285,05
12468,76
美国
Callahan
19992,23
8686,72
9649,99
18625,08
美国
Davolio
17885,82
15925,56
32394,91
29644,07
美国
Fuller
11434,38
22136,67
16148,8
21448,29
美国
Leverling
28406,85
33493,13
10888,96
30930,13
美国
Peacock
41088,53
22389,61
31231,12
29946,3
3.6、
(1)
食品重量
频数
40-45
13
46-50
37
51-55
33
56-60
16
61-70
1
(2)
频数分布的直方图
(3)可以直观的看出,食品重量的分布右边的尾部比左边的尾部长一些,略微有一些右偏分布。
3.11
3.12
(1)
统计学考试成绩条形图
统计学考试成绩环形图
(2)此数据为顺序型数据,甲班的中位数为中,乙班的中位数为良,由此大致可推断,乙班的总体水平优于甲班的总体水平。
(3)
统计学考试成绩雷达图
甲班人数比重最大的是中,人数比重最小的是优,而乙班人数比重最大的是良,最小的是不及格,由此可见,两班考试成绩的分布明显不相似。
六、讨论与结论
通过实验我知道数据经过预处理后,可根据需要进行分类和分组,不同类型的数据所采取的处理方式是不同的。
对于数据的图示,我明白了分组数据中,单变量数据用直方图,而多变量数据就要用到散点图、雷达图等图示方法。
还有,就是对统计数据特征的观察,要选折好的图示才能方便观察,比如环形图就不适合特征观察。
实验报告评分表
学生姓名
学号
专业年级
实验项目名称
数据的整理与显示
实验学时
3
评价项目
权重
评价内容
评价结果
得分
A
B
C
D
实验态度
20%
实验态度端正,遵守实验室守则,严格按照实验要求进行操作。
20
16
14
12
实验过程
30%
实验项目符合大纲,实验方法科学;步骤操作合理,逻辑条理清晰,符合指导书要求。
30
24
21
18
实验结论与讨论
30%
实验结论正确,分析、讨论深入。
30
24
21
18
实验报告描述
20%
语言精炼、流畅、准确、灵活,逻辑性强;结构严谨规范,条理清晰,布局合理,系统严密。
20
16
14
12
总分
教师签名
统计实验二:
用EXCEL展示数据的分布特征及列联分析
一、实验目的及要求
(一)目的
⑴掌握利用EXCEL的命令对数据的分布特征进行描述;
⑵掌握利用函数命令对数据进行计算分析,
⑶掌握利用EXCEL的命令对数据分布特征进行分析,
⑷掌握利用EXCEL进行列联分析
(二)内容及要求
4.01根据表4-01描述2007与2000年中国人口分布状况及其特征,并比较在这段时间里人口特征的变化。
9.3根据数据,以0.05的显著性水平检验读者的阅读习惯是否与文化程度有关。
9.4根据数据,以0.05的显著性水平检验学生本科所学专业是否影响其读MBA期间所学课程,并计算P值。
二、仪器用具
实验场所:
经管院实验室
硬件:
计算机(安装Windows98、Windows2000或WindowsXP或以上)
软件:
EXCEL
三、实验原理
利用数据分布特征的基本知识对数据进行描述,包括集中趋势分布特征,离散分布特征以及数据分布的基本形状;根据卡方检验的基本原理对数据进行处理;根据数据的特征选择合适的变量进行多元回归模型的拟和和检验。
四、实验方法与步骤
⑴数值型数据的EXCEL整理和显示
“工具”——“数据分析”——“直方图”
⑵数据的分布特征的EXCEL处理
“工具”——“数据分析”——“描述统计”
⑶数据计算分析
“插入”——“函数”——命令选择
⑷列联分析的EXCEL处理
“插入”——“函数”——“统计”——“CHITEST”
五、实验结果与数据处理
4.01年龄和人口
2000年全国人口变动情况折线图
2007年全国人口变动情况折线图
2000与2007年中国男性人口比女性人口略多,男女年龄分布与总人口走向一致,2000年总人口峰值出现在10-14岁和30-34岁处,2007年总人口峰值出现在35-44岁处,2007年人口分布右边的尾部比2000年更翘,由此可看出,人口平均年龄增大,呈现老龄化趋势。
9.3
期望
大学以上
大学和大专
高中
高中以下
早上看
15,15748
17,91339
8,267717
8,661417
中午看
13,33858
15,76378
7,275591
7,622047
晚上看
28,79921
34,03543
15,70866
16,45669
有空看
19,70472
23,2874
10,74803
11,25984
77
91
42
44
行
列
f0
fe
f0-fe
(f0-fe)2
(f0-fe)2/fe
1
1
6
15,15748
-9,15748
83,8594457
5,53254525
2
1
12
13,33858
-1,33858
1,79180358
0,134332382
3
1
38
28,79921
9,200787
84,6544888
2,939472339
4
1
21
19,70472
1,295276
1,67773886
0,08514399
1
2
13
17,91339
-4,91339
24,1413603
1,347671541
2
2
16
15,76378
0,23622
0,05580011
0,003539767
3
2
40
34,03543
5,964567
35,5760587
1,045265344
4
2
22
23,2874
-1,2874
1,65740281
0,071171651
1
3
14
8,267717
5,732283
32,8590737
3,974383202
2
3
8
7,275591
0,724409
0,52476905
0,072127348
3
3
11
15,70866
-4,70866
22,1714923
1,41141831
4
3
9
10,74803
-1,74803
3,05561411
0,284295232
1
4
17
8,661417
8,338583
69,5319611
8,027780959
2
4
8
7,622047
0,377953
0,14284829
0,018741459
3
4
6
16,45669
-10,4567
109,342427
6,644252722
4
4
13
11,25984
1,740157
3,02814806
0,268933429
31,86107492
R=4
C=4
自由度=(R-1)*(C-1)=9
H0:
读者的阅读习惯与文化程度无关
H1:
读者的阅读习惯与文化程度无关有关
α=0.05,χ20.05(9)=16.9190
χ2=31.86107
χ2>χ20.05(9),所以拒绝H0,读者的阅读习惯与文化程度有关
9.4
行
列
f0
fe
f0-fe
(f0-fe)2
(f0-fe)2/fe
1
1
31
24,08
6,92
47,90
1,9893
1
2
13
17,37
-4,37
19,08
1,0987
1
3
16
18,55
-2,55
6,52
0,3512
2
1
8
12,44
-4,44
19,72
1,5852
2
2
16
8,97
7,03
49,37
5,5015
2
3
7
9,59
-2,59
6,68
0,6974
3
1
12
15,65
-3,65
13,33
0,8518
3
2
10
11,29
-1,29
1,66
0,1473
3
3
17
12,06
4,94
24,41
2,0243
4
1
10
8,83
1,17
1,37
0,1553
4
2
5
6,37
-1,37
1,87
0,2940
4
3
7
6,80
0,20
0,04
0,0057
14,7019
R=4
C=3
自由度=(R-1)*(C-1)=6
H0:
读者的阅读习惯与文化程度无关
H1:
读者的阅读习惯与文化程度无关有关
α=0.05,χ20.05(6)=12.5916
χ2=14.7019
χ2>χ20.05(6),所以拒绝H0,读者的阅读习惯与文化程度无关有关
六、讨论与结论
通过实验过程的进行,对统计学的有关知识点的复习也与之同步。
利用X2分布对两个分类变量之间的相关性的统计检验,X2的值越大,拟合优度越小。
我可以将自己所学的知识应用于实践中,理论和实际是不可分的,在实践中我的知识得到了巩固。
其次,本次实验开阔了我的视野,使我对统计在现实中的运作有所了解,也对统计也有了进一步的掌握。
实验报告评分表
学生姓名
学号
专业年级
实验项目名称
用EXCEL展示数据的分布特征及列联分析
实验学时
3
评价项目
权重
评价内容
评价结果
得分
A
B
C
D
实验态度
20%
实验态度端正,遵守实验室守则,严格按照实验要求进行操作。
20
16
14
12
实验过程
30%
实验项目符合大纲,实验方法科学;步骤操作合理,逻辑条理清晰,符合指导书要求。
30
24
21
18
实验结论与讨论
30%
实验结论正确,分析、讨论深入。
30
24
21
18
实验报告描述
20%
语言精炼、流畅、准确、灵活,逻辑性强;结构严谨规范,条理清晰,布局合理,系统严密。
20
16
14
12
总分
教师签名
统计实验三:
多元回归及时间序列分析
一、实验目的及要求
(一)目的
⑴熟悉EXCEL用于时间序列分析的基本菜单操作及命令;
⑵掌握EXCEL用于移动平均、季节指数的基本菜单操作及命令。
⑶掌握EXCEL用于回归分析的基本菜单操作及命令。
(二)内容及要求
13.07对这一时间序列的构成要素进行分解,并作出图形进行分析,并预测2010年第一至第四季度数据。
12.03写出估计的多元回归方程,在销售价格的总变差中,被估计的回归方程所解释的比例是多少?
检验回归方程的线性关系是否显著(=0.05),检验各回归系数是否显著(=0.05)。
二、仪器用具
实验场所:
经管院实验室
硬件:
计算机(安装Windows98、Windows2000或WindowsXP或以上)
软件:
EXCEL
三、实验原理
通过图形的绘制观察数据的变动情况,利用移动平均法、指数平滑法、季节指数的测定、趋势的测定等方法确定并分析时间序列的趋势、季节以及周期性的变动特征。
四、实验方法与步骤
⑴图形描述的EXCEL处理
“图表向导”——“折线图”
⑵多元回归的EXCEL处理
⑶“工具”——“数据分析”——“回归”
⑷移动平均的数据处理
“工具”——“数据分析”——“移动平均”
⑸指数平滑的EXCEL处理
“工具”——“数据分析”——“指数平滑”
五、实验结果与数据处理
13.07、
年/季
1
2
3
4
2000
——
——
1627,9875
1833,088
2001
2161,088
2511,0875
2736,725
2897,963
2002
2953,063
3104,675
3392,825
3718,4
2003
4205,425
4718,4125
5037,175
5225,988
2004
5496,263
5941,125
6420,675
6729,475
2005
7031,338
7233,0375
7199,35
7161,113
2006
7269,838
7324,425
7254,35
7328,513
2007
7338,813
7300,0375
7356,2125
7293,7
2008
7112,338
6894,7375
6918,725
6995,125
2009
6908,1
6908,675
——
——
合计
50476,26
51936,213
47944,025
49183,36
平均
5608,474
5770,6903
5327,113889
5464,818
22171,1
5542,773958
季节指数
1,011853
1,0411195
0,961091672
0,985936
4
要素分离后的销售量及其趋势图
12.03、
y=148.700453+0.814738x1+0.820980x2+0.135041x3
被回归方程解释的比例为
RSquare
0,897495632
SignificanceF<α
线性关系显著
β1=0.131099>α
地产估价的影响不显著
β2=0.001307<α
房产估价的影响显著
β3=0.057088>α
使用面积的影响不显著
六、讨论与结论
通过实验,我了解到,在实际过程中,影响因变量的因素往往有多个,常常要用到多元回归原理。
还有,对时间序列分析时,要先作图,然后根据图形观察数据随时间的变化趋势。
时间序列中也含有不同的成分,试验中主要用到季节性的成分。
本次实验,让我在掌握操作步骤完成实验任务的同时,也在实验中验证自己所学的知识。
统计学的学习就是对数据的学习,而通过实验可以加强我们对统计数据的认知和运用,更好的学习统计学的知识。
实验报告评分表
学生姓名
学号
专业年级
实验项目名称
多元回归及时间序列分析
实验学时
3
评价项目
权重
评价内容
评价结果
得分
A
B
C
D
实验态度
20%
实验态度端正,遵守实验室守则,严格按照实验要求进行操作。
20
16
14
12
实验过程
30%
实验项目符合大纲,实验方法科学;步骤操作合理,逻辑条理清晰,符合指导书要求。
30
24
21
18
实验结论与讨论
30%
实验结论正确,分析、讨论深入。
30
24
21
18
实验报告描述
20%
语言精炼、流畅、准确、灵活,逻辑性强;结构严谨规范,条理清晰,布局合理,系统严密。
20
16
14
12
总分
教师签名