武汉理工大学 统计学 学生实验报告书.docx
《武汉理工大学 统计学 学生实验报告书.docx》由会员分享,可在线阅读,更多相关《武汉理工大学 统计学 学生实验报告书.docx(14页珍藏版)》请在冰豆网上搜索。
武汉理工大学统计学学生实验报告书
实验报告
实验课程名称:
统计学
实验项目名称
(一)制作次数分布图标
(二)计算描述统计量
(三)进行长期趋势预测
(四)抽样调查区间统计
实验日期
2018-11-26
2018-11-28
2018-11-30
实验者
专业班级
信管16
组别
预习成绩
实验报告
成绩
总成绩
一、实验目的、意义
(一)制作次数分布图标:
1、进一步熟悉次数分布的概念、原理和构成。
2、学会用计算机制作次数分布的图表。
(二)计算描述统计量:
熟悉计算平均数、标准差方差等描述统计量的方法,学会用计算机计算以上统计量
(三)动态数列长期趋势预测:
进一步熟悉用最小平方法进行长期预测,用计算机进行长期趋势预测
(四)抽样调查区间估计:
进一步熟悉区间估计的方法、学会用计算机做区间估计
二、实验基本原理
(一)制作次数分布图标:
利用次数分布的原理,以及Excel系统制作次数分布的图表。
(二)计算描述统计量:
计算平均指标、标志变动度的原理和EXCEL系统。
(三)动态数列长期趋势预测:
最小平均法进行直线趋势预测的原理和EXCEL系统。
(四)抽样调查区间估计:
抽样推测的原理和EXCEL系统。
三、实验主要仪器设备及耗材
(一)制作次数分布图标:
计算机,计算机互联网系统。
(二)计算描述统计量:
计算机、互联网系统。
(三)进行长期趋势预测:
计算机、互联网系统。
(四)进行抽样调查区间估计:
计算机、互联网系统。
四、实验主要操作步骤
(一)制作次数分布图表:
1.进入Excel系统,输入数据项目的所有数据;(以40学生考试成绩为例)
2.选择“工具”,拉下菜单,选择“数据分析”;
3.在对话框中选择“直方图”,选择确定;
4.在对话框输入区中键入试验项目的数据的范围(A2:
A41),在接受区键入分组的范围(B2:
B6),在输出区键入输出的任意行,再选择“累计百分比”、“输出图表”,选择确定。
(二)计算描述统计量:
(例:
某煤矿6月份每天的燃煤产量为例)
1,进去Excel系统,输入试验项目的所有数据
2,选择工具拉下菜单,选择数据分析
3,在对话框中选择描述统计、选择确定
4,在对话框的输入区域输入试验项目的数据范围A2:
A31,在输出区域输入D3,选择汇总统计,选择确定。
(三)动态数列长期趋势预测
1,进入Excel系统,输入实验项目的有关数据
2、建立直线趋势方程:
Yc=a+bt,利用最小平方法计算a和b的参数
3、将参数代入直线趋势方程,Yc=a+bt,预测所需年份的产量
(四)抽样调查区间估计(从一批灯泡中随即抽取40只进行检查,并对该批全部灯泡的平均使用时间的可能范围)
1、进去Excel系统,输入实验项目的全部数据,输入计算指标、计算公式
2、利用各公式计算相应的指标
3、利用区间估计的方法计算区间估计
五、原始数据记录
(一)制作次数分布图表(直方图)
某班40名学生考试成绩如下(单位:
分)
成绩:
66459956889984817694797799826573747798656079676682975983607872638995847986789887
答:
首先,打开Excel并新建一个工作簿,输入试验项目的所有数据;然后,点击工具菜单栏的【数据】,并选择【数据分析】;再在对话框中选择【直方图】并点击确定;然后,在对话框的【输入区域】输入试验项目的数据范围(A2:
A41),在【接收区域】输入分组的范围(B2:
B6),在【输出区域】输入D2,并勾选【累计百分比】和【输出图表】,点击确定。
最后得到次数分布图表如下图所示:
图1在Excel中制作次数分配图表
由上述图表可知,该班学生考试成绩在50分及以下的有1人,50分(不包含50分)到60分(包含60分)之间的有4人,60分(不包含60分)到70分(包含70分)之间的有6人,70分(不包含70分)到80分(包含80分)之间的有11人,80分(不包含80分)到90(包含90分)分之间的有10人,90分以上的有8人。
(二)计算描述统计量(某煤矿6月份的燃煤产量,单位:
万吨)
30个产量的原始数据如下:
产量:
201022002400196520102025204220502080210121032130215221931100223022802282230023382342234523612382239024242450156019801900
答:
首先,打开Excel并新建一个工作簿,输入试验项目的所有数据;然后,点击工具菜单栏的【数据】,并选择【数据分析】;再在对话框中选择【描述统计】并点击确定;然后,在对话框的【输入区域】输入试验项目的数据范围A2:
A31,在【输出区域】输入D3,选择【汇总统计】,并点击确定。
最后得到描述统计量的计算结果如下图所示:
图2在Excel中计算描述统计量
(三)动态数列长期趋势预测
根据某地区2001-2009年的产量资料,利用最小平方法预测2010年的粮食产量
年份
2001
2002
2003
2004
2005
2006
2007
2008
2009
产量
220
230
225
248
255
261
369
309
343
答:
首先,打开Excel并新建一个工作簿,输入试验项目的所有数据。
实验数据输入结果如下图所示:
图3在Excel中输入本题数据
然后,点击工具菜单栏的【数据】,并选择【数据分析】;再在对话框中选择【回归】并点击确定;然后,在对话框的【Y值输入区域】和【X值输入区域】分别输入其数据的对应区域,在【输出区域】输入B16,并点击确定。
最后得到相关输出结果如下图所示:
图4在Excel中对本题数据进行回归分析
由上述图表可知,直线趋势方程:
Yc=a+bt中a的估计值为273.33,b的估计值为17.167;然后,将上述a和b的估计值代入直线趋势方程:
Yc=a+bt,由此可以预测2010年的粮食产量为273.333+17.167*5=359.168
(四)抽样调查区间估计
从一批灯泡中随机抽取40只检查其使用寿命,并对该批全部灯泡的平均使用寿命进行区间估计:
样本数据:
6788869481027901928991345800999948978105094686781699195098810018278648499189091049958104090492793488889194910001098996852878800
答:
首先,打开Excel并新建一个工作簿,输入试验项目的所有数据(数据输入区域为A2:
A41);然后,通过使用Excel自带的函数进行区间估计相应指标的计算。
此处我假设置信度为95%(即α=0.05),最后得到相应指标的计算结果如下图所示:
图5利用Excel进行区间估计相应指标的计算
由上述表格可知,该批全部灯泡的平均使用寿命的置信区间为[875.88,952.57]
5、单位按简单随机重复抽样方式抽取40名职工,对其业务情况进行考核,考试成绩资料如下:
68
89
88
84
86
87
75
73
72
68
75
82
99
58
81
54
79
76
95
76
71
59
91
65
76
72
76
85
89
92
64
57
83
81
78
77
72
61
70
87
要求:
(1)根据上述资料按成绩分成以下几组:
60分以下,60-70分,70-80分,80-90分,90-100分,并根据分组整理成变量分配数列;
(2)根据整理后的变量数列,以95.45%的概率保证程度推断全体职工业务考试成绩的区间范围;
答:
首先,打开Excel并新建一个工作簿,输入试验项目的所有数据;然后,点击工具菜单栏的【数据】,并选择【数据分析】;再在对话框中选择【直方图】并点击确定;然后,在对话框的【输入区域】输入试验项目的数据范围(A2:
A41),在【接收区域】输入分组的范围(B2:
B6);在【输出区域】输入D2,并勾选【累计百分比】和【输出图表】,点击确定。
最后得到次数分布图表如下图所示:
图6在Excel制作次数分配图表
由于Excel制作次数分配图表遵循的是下组限不在内原则,因此我对以上次数分配图表进行了修正,得到满足上组限不在内原则的变量分配图表如下图所示:
图7编制变量分配数列
然后,通过使用Excel自带的函数进行区间估计相应指标的计算。
由题意给出的95.45%的概率保证程度可知t值等于2,最后得到相应指标的计算结果如下图所示:
图8相应指标的计算结果
由上述表格可知,在95.45%的概率保证下,全体职工业务考试成绩的区间范围为[73.29,80.21]
6、根据某地区2011-2016年的工业产值资料,利用最小平方法预测2017年的工业产值(千万元)
年份
2011
2012
2013
2014
2015
2016
产值
5.3
7.2
9.6
12.9
17.1
23.2
(1)计算环比增产速度,并作出散点图;
(2)拟合回归方程
(3)预测2017产值
答:
(1)首先,打开Excel并新建一个工作簿,输入试验项目的所有数据。
实验数据输入结果如下图所示:
图9在Excel中输入本题数据
然后,通过公式“环比增长速度=环比发展速度-1”计算环比增长速度。
然后,选中t列和y列的数据,点击工具菜单栏的【插入】并选择其中的【散点图】,最后得到环比增长速度的计算结果和某地区2011-2016年的工业产值的散点图如下图所示:
图10环比增长速度和散点图
(2)然后,点击工具菜单栏的【数据】,并选择【数据分析】;再在对话框中选择【回归】并点击确定;然后,在对话框的【Y值输入区域】和【X值输入区域】分别输入其数据的对应区域,在【输出区域】输入B12,并点击确定。
最后得到相关输出结果如下图所示:
图11在Excel中对本题数据进行回归分析
由上述图表可知,直线回归方程:
Yc=a+bt中a的估计值为12.55,b的估计值为1.75;因此可以得到拟合回归方程为Yc=12.55+1.75t
(3)因为2017年对应的t值为7,所以将t=7代入拟合回归方程:
Yc=12.55+1.75t即可,求得Yc=12.55+1.75*7=24.8,由此可以预测2017年的工业产值为24.8千万元。
7、地区2003年-2015年粮食产量、牲畜头数和有机肥量有关资料如下:
年份
粮食产量(亿千克)
有机肥(万吨)
牲畜头数(头数)
2003
25
44
15
2004
23
42
15
2005
24
45
14
2006
23
45
16
2007
24
46
15
2008
25
44
17
2009
26
46
16
2010
26
46
15
2011
25
44
15
2012
27
46
16
2013
28
45
18
2014
30
48
20
2015
31
50
19
根据上表资料:
(1)建立多元线性回归方程;
(2)计算二元回归方程的判定系数和估计标准误差;
(3)如果已知2016年有机肥有量为52万吨,牲畜头数为21万头,预测该年粮食产量为多少。
答:
(1)首先,打开Excel并新建一个工作簿,输入试验项目的所有数据。
实验数据输入结果如下图所示:
图12在Excel中输入本题数据
然后,点击工具菜单栏的【数据】,并选择【数据分析】;再在对话框中选择【回归】并点击确定;然后,在对话框的【Y值输入区域】和【X值输入区域】分别输入其数据的对应区域,在【输出区域】输入G2,并点击确定。
注意,此处【Y值输入区域】指的是粮食产量所在列的数据,而【X值输入区域】包括有机肥和牲畜头数两列的数据。
最后得到相关输出结果如下图所示:
图13在Excel中对本题数据进行回归分析
由上述图表可知,直线回归方程:
Yc=a+b1*x1+b2*x2中a的估计值为-12.832,b1的估计值为0.5803,b2的估计值为0.7624;
因此可以得到拟合回归方程为Yc=-12.832+0.5803*x1+0.7624*x2
(2)由上述图表可知,该二元回归方程的判定系数(r^2)为0.8356,修正后的判定系数为0.8027;估计标准误差为1.1098
(3)因为已知2016年有机肥有量为52万吨,牲畜头数为21万头,所以将x1=52,x2=21代入拟合回归方程:
Yc=-12.832+0.5803*x1+0.7624*x2即可。
求得Yc=-12.832+0.5803*52+0.7624*21=33.354,由此可以预测该年粮食产量为33.354亿千克。
8、试用指数平滑法进行预测
时间
实际销售量
Jan-10
1.9
Feb-10
1.7
Mar-10
1.4
Apr-10
1.5
May-10
1.8
Jun-10
1.6
Jul-10
1.6
Aug-10
1.9
Sep-10
2.3
Oct-10
2.7
Nov-10
2.3
Dec-10
2.1
Jan-11
0.7
试计算当
时的预测值,并判断哪一个最准确。
答:
首先,打开Excel并新建一个工作簿,输入试验项目的所有数据;然后,点击工具菜单栏的【数据】,并选择【数据分析】;再在对话框中选择【指数平滑】并点击确定;然后,在对话框的【输入区域】输入试验项目的数据范围(B3:
B15),在【阻尼系数】输入其数值(阻尼系数=1-α),在【输出区域】输入相应位置范围,点击确定。
针对不同的α值,重复执行以上操作;并取第一期的实际观测值作为初始预测值。
计算误差平方和时会用到Excel的SUMXMY2函数,最后得到结果如下图所示:
图14在Excel中运用指数平滑法进行预测
由上述图表可知,当α=0.9时,误差平方和最小,因此它的预测值最准确。
9、试用灰色GM(1,1)模型进行预测
表1-4祖国大陆从台湾地区进口有机化学品贸易统计量单位:
万吨
年份
2003
2004
2005
2006
2007
2008
2009
2010
2011
2012
2013
2014
2015
2016
进口总量
22.8
30.5
21.7
22.1
40.8
93.1
166.7
214.6
256.3
342.8
406.4
644.3
736.2
805.4
答:
首先,打开灰色系统理论建模软件,选择菜单栏中【灰色预测模型】下的GM(1,1)模型。
然后,输入试验项目的所有数据。
最后,点击【计算>>模拟>>】即可。
另外,此处我选择预测接下来3年的进口总量。
得到的输出结果如下图所示:
图15灰色预测模型GM(1,1)的初次使用
由上图可知,该预测方法的平均相对误差达到41.2%,因此我对数据的【输入】提出了质疑。
因为我的目的是预测接下来3年的进口总量,并且题中数据变化较为剧烈,所以我认为最近几年的数据更具有参考价值和代表性。
因此,我舍弃了前几年的一些数据,重新进行了计算。
得到结果如下图所示:
图16灰色预测模型GM(1,1)的第二次使用
由上图可知,此时平均相对误差降低到8.26%,因此我认为此时的预测值更为准确。