统计学实验报告 实验三 四.docx
《统计学实验报告 实验三 四.docx》由会员分享,可在线阅读,更多相关《统计学实验报告 实验三 四.docx(20页珍藏版)》请在冰豆网上搜索。
统计学实验报告实验三四
重庆工商大学数学与统计学院
实验报告
实验课程:
统计学实验
******
专业班级:
14信管__
*********____
学生学号:
**********_____
实验报告
实验项目
实验三统计数据的描述实验四长期趋势和季节变动测定
实验日期
2016.5.3
实验地点
80608
实验目的
1、熟练掌握各种描述统计指标对应的函数
2、掌握运用“描述统计”工具进行描述统计的方法,对结果能进行解释
3、掌握测定长期直线趋势的方法
4、掌握测定季节变动的方法
实验内容
1、《统计学实验》教材第三章第
(1)题。
2、联合食品公司为了了解客户的支付方式和金额,作了抽样调查并得到100个客户的样本资料如下:
现金支付
个人支票
信用卡支付
现金支付
个人支票
信用卡支付
7.40
27.60
50.30
5.80
52.87
69.77
5.51
30.60
33.76
20.48
78.16
48.11
4.75
41.58
25.57
16.28
25.96
15.10
36.09
46.42
15.57
31.07
8.81
2.67
46.13
6.93
35.38
1.85
34.67
14.44
7.17
58.11
7.41
58.64
43.79
11.54
49.21
11.77
57.59
19.78
13.09
31.74
12.07
43.14
52.35
16.69
50.58
9.00
21.11
52.63
7.02
59.78
5.98
52.04
57.55
18.09
72.46
7.88
18.77
27.66
2.44
37.94
5.91
42.83
44.53
1.09
42.69
3.65
55.40
26.91
2.96
41.10
14.28
48.95
55.21
11.17
40.51
1.27
36.48
54.19
16.38
37.20
2.87
51.66
22.59
8.85
54.84
4.34
28.58
53.32
7.22
58.75
3.31
35.89
26.57
17.87
15.07
39.55
27.89
69.22
要求:
(1)利用公式法计算各种支付方式对应的支付金额的平均数和标准差;
(2)利用“描述统计”工具计算各种支付方式对应的支付金额的平均数和标准差;
(3)对得到的结果进行简要的解释。
3、某大学的学生为了了解该校学生使用电脑的情况,随机抽取了30名女生和30名男生,数据见下表。
性别
每周使用
电脑时间
其中上
网时间
使用电
脑用途
性别
每周使用
电脑时间
其中上
网时间
使用电
脑用途
女
20
20
CE
男
5
3.5
ACE
女
8
6
CDE
男
30
10
ABCE
女
25
25
CDE
男
20
5
BCE
女
18
18
ABE
男
15
0
B
女
10
8
ACD
男
5
5
C
女
5
5
D
男
20
19
BCE
女
6
3
CDE
男
7
4
ACDE
女
4
3
AC
男
20
20
BCEF
女
2
2
D
男
5
4.5
AC
女
2
2
DE
男
15
10
ACE
女
14
14
CD
男
20
5
ACEF
女
12
10
CDE
男
10
9
CD
女
8
7
CD
男
5
4.5
CD
女
15
15
CDE
男
7
4
BCD
女
15
12
CE
男
5
3
CD
女
20
20
BCE
男
20
20
BC
女
10
10
CD
男
5
5
ACD
女
2
1
DE
男
30
15
BCE
女
6
4
ACE
男
25
5
BCE
女
10
8
ACE
男
20
18
BCF
女
10
4
CDEF
男
30
20
ACE
女
10
8
ACD
男
20
10
DF
女
12
10
CDE
男
10
8
AC
女
5
5
D
男
14
12
BD
女
5
5
CD
男
15
10
ADF
女
10
3
AC
男
18
15
BE
女
20
20
CDE
男
10
8
AC
女
4
3
AE
男
16
12
ABF
女
3
1
ACF
男
10
7
DF
女
14
8
ACE
男
15
14
CD
其中,在使用电脑用途中,各符号的含义为:
A:
写论文等作业B:
游戏C:
聊天(qq)、写邮件
D:
浏览信息、新闻、书籍E:
听歌、看电影F:
学习各种软件的使用
要求:
试运用描述统计方法,对该校学生使用电脑的情况作简要分析,写出分析报告。
4.某企业2004-2015年的各年产量数据如下表(单位:
万件)
年份
2004
2005
2006
2007
2008
2009
产量
100
95
98
107
110
105
年份
2010
2011
2012
2013
2014
2015
产量
107
115
123
115
120
125
①绘制时间序列图描述其趋势。
②用3年移动平均法计算移动平均值。
5.查找并填充下列表格中的重庆市1985-2014年粮食产量数据。
年份
粮食产量(万吨)
年份
粮食产量(万吨)
1985
948.97
2000
1131.21
1986
1004.92
2001
1035.35
1987
1004.51
2002
1082.15
1988
958.02
2003
1087.20
1989
1044.88
2004
1144.57
1990
1085.07
2005
1168.19
1991
1115.28
2006
910.50
1992
1050.24
2007
1993
1052.72
2008
1994
1134.10
2009
1995
1153.68
2010
1996
1172.14
2011
1997
1184.63
2012
1998
1155.36
2013
1999
1143.05
2014
要求:
①绘制时间序列图描述其趋势。
②采用两种方法选择一条合适的趋势线拟合数据,并根据趋势线预测2015年的粮食产量。
备注:
粮食产量数据查询页面。
6.下表是一家啤酒生产企业2007-2012年各季度的啤酒销售量数据。
年份
季度
一
二
三
四
2007
25
32
37
26
2008
30
38
42
30
2009
29
39
50
35
2010
30
39
51
37
2011
29
42
55
38
2012
31
43
54
41
要求:
①判断该时间数列是否受长期趋势的影响。
②计算各季度的季节指数。
评分项目
得分
实验内容完整
实验步骤完整、清楚
实验方法正确
实验结果完整、清楚、合理
总分
实验过程、结果及结果分析
1.
第一步,将数据和要求的相应数值的名称输入Excel表格中。
数据区域是“A1:
J4”,名称区域是“K2:
K9”。
第二步,单击单元格L2,在“插入”菜单中选择“函数”项,从弹出对话框左侧“函数分类”列表中选择“统计”,从右侧“函数名”列表中选择MEDIAN函数,点击“确定”按钮。
第三步,填写对话框,在数据区域number1填写“A1:
J4”,点击“确定”按钮。
就可以得出中位数。
其他数值的求法同上。
(算术平均数、众数、最大值、最小值、四分位差、样本标准差、样本方差对应的函数名称分别是AVERAGE、MODE、MAX、MIN、QUARTILE、STDEV、VAR),最终求得的结果如下:
中位数
72.5
算术平均数
72.45
众数
78
最大值
98
最小值
45
四分位差
14.5
样本标准差
11.59786
样本方差
134.5103
2.
(1)第一步,将表格复制到Excel表格中,并进行整理。
第二步,单击单元格G2,在“插入”菜单中选择“函数”项,从弹出对话框左侧“函数分类”列表中选择“统计”,从右侧“函数名”列表中选择AVERAGE函数,点击“确定”按钮。
第三步,填写对话框,在数据区域number1填写“A2:
A39”,点击“确定”按钮。
就可以得出现金支付的平均数。
第四步,单击单元格G3,在“插入”菜单中选择“函数”项,从弹出对话框左侧“函数分类”列表中选择“统计”,从右侧“函数名”列表中选择STDEV函数,点击“确定”按钮。
第五步,填写对话框,在数据区域number1填写“A2:
A39”,点击“确定”按钮。
就可以得出现金支付的标准差。
计算个人支付和信用卡支付的平均数和标准差的步骤同上,最后得到的结果如下:
现金支付
个人支票
信用卡支付
平均数
8.868421053
42.732
40.885
标准差
5.260687205
15.62186046
14.87695589
(2)第一步,在“工具”菜单中单击“数据分析”选项,选择“描述统计”。
第二步,回车进入“描述统计”对话框,在“输入区域”中输入“A2:
A39”,在分组方式后选择“逐列”在“输出区域”框中输入F6.根据需要选择“汇总统计”。
第三步,单击“确定”,即在指定区域输出结果。
第四步,对得到的数据进行整理。
计算个人支付和信用卡支付的平均数和标准差的步骤同上,最后得到的结果如下:
现金支付
个人支票
信用卡支付
平均
8.868421053
42.732
40.885
标准误差
0.853396155
2.470033016
3.171777654
中位数
7.405
41.34
45.33
标准差
5.260687205
15.62186046
14.87695589
方差
27.67482987
244.0425241
221.3238167
峰度
-0.841915879
0.266624632
-1.001660772
偏度
0.43043075
-0.033009748
-0.118845468
区域
19.39
75.49
55.33
最小值
1.09
2.67
14.44
最大值
20.48
78.16
69.77
求和
337
1709.28
899.47
观测数
38
40
22
(3)“平均”指样本平均值,38名用现金支付的顾客支付的平均金额为8.868421053;40名用个人支票的顾客支付的平均金额为42.732;22名用信用卡支付的顾客支付的平均金额为40.885。
“标准差”是样本标准差,表示以38名用现金支付的顾客为样本,支付金额的标准差为5.260687205;以40名用个人支票的顾客为样本,支付金额的标准差为15.62186046;以22名用信用卡支付的顾客为样本,支付金额的标准差为14.87695589。
由此可知,被调查者倾向于个人支票支付和信用卡支付,支付金额灵活,现金支付方式大多适用于小金额支付。
3.
(1)运用数据分析的描述统计,可以分别得出男生和女生每周使用电脑时间和其中上网时间的一些相关数据,结果如下:
基本数据对比
女生
每周使用电脑时间
其中上网时间
平均
10.1667
平均
8.666667
标准误差
1.127589
标准误差
1.200894
中位数
10
中位数
7.5
众数
10
众数
8
标准差
6.176057
标准差
6.577565
方差
38.14368
方差
43.26437
峰度
-0.3217
峰度
0.001709
偏度
0.611292
偏度
0.959403
区域
23
区域
24
最小值
2
最小值
1
最大值
25
最大值
25
求和
305
求和
260
观测数
30
观测数
30
最大
(1)
25
最大
(1)
25
最小
(1)
2
最小
(1)
1
男生
每周使用电脑时间
其中上网时间
平均
14.9
平均
9.516666667
标准误差
1.43387
标准误差
1.060655656
中位数
15
中位数
8.5
众数
20
众数
5
标准差
7.85362
标准差
5.809450288
方差
61.6793
方差
33.74971264
峰度
-0.6731
峰度
-0.791612144
偏度
0.38438
偏度
0.554409283
区域
25
区域
20
最小值
5
最小值
0
最大值
30
最大值
20
求和
447
求和
285.5
观测数
30
观测数
30
最大
(1)
30
最大
(1)
20
最小
(1)
5
最小
(1)
0
置信度(95.0%)
2.93259
置信度(95.0%)
2.169284356
(2)用途范围对比
女生
用途数
学生数
百分比
1
3
10.00%
2
11
36.67%
3
15
50.00%
4
1
3.33%
男生
用途数
学生数
百分比
1
2
6.67%
2
12
40.00%
3
12
40.00%
4
4
13.33%
(3)用途对比
女生
用途
人数
百分比
A:
写论文等作业
10
13.51%
B:
游戏
2
2.70%
C:
聊天(qq)、写邮件
23
31.08%
D:
浏览信息、新闻、书籍
19
25.68%
E:
听歌、看电影
18
24.32%
F:
学习各种软件的使用
2
2.70%
74
男生
用途
人数
百分比
A:
写论文等作业
12
15.38%
B:
游戏
13
16.67%
C:
聊天(qq)、写邮件
23
29.49%
D:
浏览信息、新闻、书籍
11
14.10%
E:
听歌、看电影
12
15.38%
F:
学习各种软件的使用
7
8.97%
78
由上述对比可以得出以下结论:
(1)该校女生每周平均使用电脑时间和其中上网时间均比男生要少。
女生平均使用电脑时间是10.17小时,男生为14.9小时;女生平均上网时间约为8.67小时,男生为9.52小时。
(2)该校女生每周使用电脑时间差异及其上网时间差异均大于男生。
(3)不管是男生还是女生,使用电脑来做2-3种事情的人数最多;并且有较多的人经常使用电脑来聊天(QQ)、写邮件。
(4)对女生来说,她们很少用电脑玩游戏和学习各种软件的使用;对男生来说,他们很少用电脑学习各种软件的使用。
4.
(1)第一步,选择“插入”菜单的“图表”子菜单,进入图表向导
第二步,选择“图表类型”为“XY散点图”,然后单击下一步
第三步,显示的对话框为“图表向导—4步骤之2”,填写图表源数据之数据区域对话框,在“数据区域”中输入A1:
B13,选择图表系列产生在“列”
第四步,单击“下一步”,出现“图表向导—4步骤之3”页面,在图表标题中输入“某企业2004-2015年的各年产量时间序列图”
第五步,单击下一步,选择图表输出的位置,然后单击完成按钮,结果如下图
(2)第一步,单击“工具”菜单中的“数据分析”选项,在其对话框“分析工具”列表中选择“移动平均”,单击“确定”,进入移动平均对话框。
第二步,选定产量数据为输入区域,间隔填:
3,表示三项平均,点击确定按钮输出数据
年份
产量
移动平均值
2004
100
2005
95
97.666667
2006
98
100
2007
107
105
2008
110
107.33333
2009
105
107.33333
2010
107
109
2011
115
115
2012
123
117.66667
2013
115
119.33333
2014
120
120
2015
125
分析:
由图表和数据可以分析出,该企业产量具有较强的长期趋势,呈逐年上升状态。
5.
年份
粮食产量(万吨)
年份
粮食产量(万吨)
2007
1088
2011
1126.9032
2008
1153.2
2012
1138.5449
2009
1137.2
2013
1148.1297
2010
1156.13
2014
1144.5396
(1)第一步,选择“插入”菜单的“图表”子菜单,进入图表向导
第二步,选择“图表类型”为“XY散点图”,然后单击下一步
第三步,显示的对话框为“图表向导—4步骤之2”,填写图表源数据之数据区域对话框,在“数据区域”中输入A1:
B31,选择图表系列产生在“列”
第四步,单击“下一步”,出现“图表向导—4步骤之3”页面,在图表标题中输入“重庆市1985-2014年粮食产量时间序列图”
第五步,单击下一步,选择图表输出的位置,然后单击完成按钮,结果如下图
分析:
由时间序列图可以知道,重庆市的粮食产量具有较强的长期趋势,呈逐年上升趋势。
(2)先绘制表格数据的散点图,发现大致拟合线性曲线。
方法一:
<1>设粮食产量为Y,年份序数为X
<2>设函数为Y=aX+b
<3>使用公式slope和intercept分别算出a和b(a=4.065943582,b=1032.290788)
<4>将X=31代入公式,得到2015年的预测结果。
方法二:
<1>选定任意一个散点,单击右键,在菜单中选择“添加趋势线”,选择“线性”
<2>在“选项”选项卡中选择“显示公式”得出线性方程:
Y=4.0659X+1032.291
则2015年预测产量=4.0659*31+1032.291=1158.33万吨
6.
(1)该时间数列受长期趋势的影响
(2)
第一步,由散点图可知数据受长期趋势的影响,所以采用移动平均趋势剔除法
第二步,单击“工具”菜单中的“数据分析”选项,在其对话框“分析工具”列表中选择“移动平均”,单击“确定”,进入移动平均对话框。
第三步,设定数据,间隔为4,粘贴在第二格上
第四步,由于是偶数移动平均,所以需要进行二次平均(T)
第五步,计算Y/T,得到如下表格
时间
序号
销售量
第一次移动平均
第二次移动平均
Y/T
2007年第一季度
1
25
第二季度
2
32
30
第三季度
3
37
31.25
30.625
1.208163265
第四季度
4
26
32.75
32
0.8125
2008年第一季度
5
30
34
33.375
0.898876404
第二季度
6
38
35
34.5
1.101449275
第三季度
7
42
34.75
34.875
1.204301075
第四季度
8
30
35
34.875
0.860215054
2009年第一季度
9
29
37
36
0.805555556
第二季度
10
39
38.25
37.625
1.03654485
第三季度
11
50
38.5
38.375
1.302931596
第四季度
12
35
38.5
38.5
0.909090909
2010年第一季度
13
30
38.75
38.625
0.776699029
第二季度
14
39
39.25
39
1
第三季度
15
51
39
39.125
1.303514377
第四季度
16
37
39.75
39.375
0.93968254
2011年第一季度
17
29
40.75
40.25
0.720496894
第二季度
18
42
41
40.875
1.027522936
第三季度
19
55
41.5
41.25
1.333333333
第四季度
20
38
41.75
41.625
0.912912913
2012年第一季度
21
31
41.5
41.625
0.744744745
第二季度
22
43
42.25
41.875
1.026865672
第三季度
23
54
第四季度
24
41
第一步,将所求出的数据分别列在空白单元格内,分别计算月平均数,总平均数,和季节指数。
第二步,季节指数=平均数/总平均数
第三步,验算可知季节指数之和=4,结果正确。
得到如下图的表格
季度
一
二
三
四
2007
1.208163265
0.8125
2008
0.898876404
1.101449275
1.204301075
0.860215054
2009
0.805555556
1.03654485
1.302931596
0.909090909
2010
0.776699029
1
1.303514377
0.93968254
2011
0.720496894
1.027522936
1.333333333
0.912912913
2012
0.744744745
1.026865672
平均数
0.789274526
1.038476547
1.270448729
0.886880283
总平均数
0.996270021