统计学实验报告.docx
《统计学实验报告.docx》由会员分享,可在线阅读,更多相关《统计学实验报告.docx(25页珍藏版)》请在冰豆网上搜索。
统计学实验报告
武汉工大学
管理学院
应用统计学课程实验(上机)报告
专业班级:
2010级工商管理01班
学号:
指导老师:
夏剑锋
实验(上机)地点:
活动中心
学期:
2012—2013年度第二学期
实验(上机)日期:
2013年4月25日第1次
实验(上机)主题:
统计软件的运用
实验(上机)类别):
验证性
完成方式:
独立
实验(上机)目的与要求:
1、掌握启动和退出统计软件
2、掌握数据库的建立
3、搜集一些数据并建立数据库
4、进行一些统计计算(函数、描述性统计)
5、制作统计图
6、计算各种统计指标
实验(上机)内容及方法
一、基本操作
1.在EXCEL图标双击,打开工作表。
2.在“文件”菜单下,选择“新建”,在右边“新建工作簿”选择“空白工作簿”。
3.单击页面右上角红色关闭按钮,关闭工作表,并退出软件。
如提醒“是否保存”则选择保存,或者选择取消在查看后在退出。
二、描述性统计
1.在数据表窗口输入数据如下:
表1-1某学科成绩表
68
76
78
94
95
68
98
82
49
76
79
76
59
86
89
95
96
68
78
81
83
58
78
63
86
76
76
66
76
69
94
69
81
68
93
78
2.单击保存,在文件名称中输入“成绩文件”
3.加载数据分析工具:
在“工具”下拉菜单下找到“加载宏”,单击,选择“数据分析工具”点击确认。
图1-1加载分析工具库
4.再在工具下拉菜单下找到“数据分析”选项。
图1-2打开数据分析
5.单击“数据分析”,选择“描述性统计”
图1-3开始描述性统计
6.数据复选框如下,单击确定,
图1-4描述性统计选项卡
7.显示结果如下:
表1-2描述性指标显示结果
平均
77.91667
区域
49
标准误差
1.972982
最小值
49
中位数
78
最大值
98
众数
76
求和
2805
标准差
11.83789
观测数
36
方差
140.1357
最大
(1)
98
峰度
-0.24247
最小
(1)
49
偏度
-0.19707
置信度(95.0%)
4.005367
三、函数计算:
1、简单函数运算:
1)将鼠标定位在单元格,进入编写模式,输入函数:
“=A1*A1”,点击回车键,在哦单元格内出现运算结果。
把鼠标移到单元个右下角,直到出现“十字”按住鼠标右键往下拉,则将运算复制。
显示结果如下:
图1-4函数输入
2)插入函数:
(用函数求和)
3)单击输入框中的函数输入符号,点击确定(如下图),计算书刚刚输入成绩的总和为:
2805
图1-5插入函数选项卡
按照同样的方法可以选择其他函数形式进行统计统计运算。
2、制作统计图:
1)直方图:
●在表格上输入分组方式:
表1-3分组方式
59
69
79
89
99
●在工具菜单下找到数据分析,单击,并在对话框中选择“直方图”,单击“确定”
图1-6直方图操作选项
图1-7直方图复选框
●统计结果如下:
表1-4频率分析表
分数
频率
59
3
69
8
79
11
89
7
99
7
其他
0
图1-8成绩分析直方图
●如果在复选框中选择“柏拉图”和“表格输出”,显示结果如下:
图1-9带累计频率的直方图
2)饼形图:
在“插入”菜单下,选择“图表”,在对话框中选择“饼形图”
图1-10饼形图选择框
根据向导输入数据,分别选择。
最终统计图表如下:
图1-11成绩分析饼形图
上机总结:
1、通过本次上机,巩固了excel的基本操作,让操作更加流畅。
2、进一步了解了函数的使用,能够熟练的掌握基本的统计量的运算。
3、通过实验的学习和比较,进一步加深了对统计量意义的学习。
实验(上机)成绩:
评阅老师:
评阅时间:
实验(上机)日期:
2013年5月9日第2次
实验(上机)主题:
假设检验与方差分析
实验(上机)类别):
验证性
完成方式:
独立
实验(上机)目的与要求:
1、建数据库:
(1)假设检验(双样本数据)
(2)方差分析:
单因素方差分析和双因素方差分析
2、掌握假设检验的计算与分析
3、掌握方差分析的计算与分析
4、输出计算结果并进行分析
5、进行检验和决策
实验上机内容及方法
一、单因素分析
1.检验数据:
表2-1三种训练方法下工人的日产量
人均日产量
方法1
15
18
19
22
11
方法2
22
27
18
21
17
方法3
18
24
16
22
15
2.将数据输入软件,并在“工具”菜单下选择“数据分析”,选择如图,单击“确认”
图2-1分析工具选择
3.在数据复选框内选择数据如下;
图2-2单因素分析复选框
结果输出:
表2-2单因素分析结果
组
观测数
求和
平均
方差
行1
5
85
17
17.5
行2
5
105
21
15.5
行3
5
95
19
15
方差分析
差异源
SS
df
MS
F
P-value
Fcrit
组间
40
2
20
1.25
0.321277
3.885294
组内
192
12
16
总计
232
14
分析:
Fcrit=3.885294;F=1.25
因为F=1.25<Fcrit=3.885294,所以拒绝训练方法对日产量有显著影响,即三种训练方法对日产量没有显著影响。
二、双因素分析(无交互作用)
实验数据
表2-34个工人和3台机器配合的日产量
B1
B2
B3
B4
A1
50
47
47
53
A2
63
54
57
58
A3
52
42
41
48
将数据输入软件,并在“工具”菜单下选择“数据分析”,选择如图,单击“确认”
图2-3无交互作用双因素分析选项
在数据复选框内选择数据如下;
图2-4无交互作用双因素分析复选框
分析结果输出:
表2-4方差分析:
无重复双因素分析
SUMMARY
观测数
求和
平均
方差
行1
4
197
49.25
8.25
行2
4
232
58
14
行3
4
183
45.75
26.91667
列1
3
165
55
49
列2
3
143
47.66667
36.33333
列3
3
145
48.33333
65.33333
列4
3
159
53
25
方差分析
显著性水平:
1%
差异源
SS
df
MS
F
P-value
Fcrit
行
318.5
2
159.25
29.10152
0.000816
10.92477
列
114.6667
3
38.22222
6.984772
0.022015
9.779538
误差
32.83333
6
5.472222
总计
466
11
方差分析:
无重复双因素分析
方差分析
显著性水平:
5%
差异源
SS
df
MS
F
P-value
Fcrit
行
318.5
2
159.25
29.10152
0.000816
5.143253
列
114.6667
3
38.22222
6.984772
0.022015
4.757063
误差
32.83333
6
5.472222
总计
466
11
分析:
行因素:
在显著性水平为1%的时候,Fcrit=10.92477,在显著性水平为5%时,Fcrit=5.143253,都远小于F=29.10152。
即不同牌号机器上的日产量有高度显著性差别。
列因素:
在显著性水平为1%的时候,Fcrit=9.779538,在显著性水平为5%时,Fcrit=4.757063,F=6.984772。
因为4.757063<6.984772<9.779538。
则不同工人的日产量只有显著的差别。
三、双因素分析(有交互作用)
实验数据
表2-5灯泡寿命数据
因子A
A1
A2
A3
因
子
B
B1
13.2
14.4
14
15
15.6
13.6
B2
16.1
13.7
16.3
17.3
14.3
17.1
B3
18
14.5
17.1
17
15.7
16.1
将数据输入软件,并在“工具”菜单下选择“数据分析”,选择如图,单击“确认”
图2-5有交互作用双因素分析
在数据复选框内选择数据如下;
图2-6有交互作用双因素分析复选框
分析结果输出:
表2-5方差分析:
可重复双因素分析
观测数
2
2
2
6
求和
28.2
30
27.6
85.8
平均
14.1
15
13.8
14.3
方差
1.62
0.72
0.08
0.796
观测数
2
2
2
6
求和
33.4
28
33.4
94.8
平均
16.7
14
16.7
15.8
方差
0.72
0.18
0.32
2.188
观测数
2
2
2
6
求和
35
30.2
33.2
98.4
平均
17.5
15.1
16.6
16.4
方差
0.5
0.72
0.5
1.52
总计
观测数
6
6
6
求和
96.6
88.2
94.2
平均
16.1
14.7
15.7
方差
3.096
0.62
2.348
方差分析
显著性水平为5%
差异源
SS
df
MS
F
P-value
Fcrit
样本
14.04
2
7.02
11.78731
0.003063
4.256495
列
6.24
2
3.12
5.238806
0.030987
4.256495
交互
10.92
4
2.73
4.583955
0.027093
3.633089
内部
5.36
9
0.595556
总计
36.56
17
方差分析
显著性水平为:
1%
差异源
SS
df
MS
F
P-value
Fcrit
样本
14.04
2
7.02
11.78731
0.003063
8.021517
列
6.24
2
3.12
5.238806
0.030987
8.021517
交互
10.92
4
2.73
4.583955
0.027093
6.422085
内部
5.36
9
0.595556
总计
36.56
17
分析:
1、因子A(工艺方法)分析:
在显著性水平为1%的时候,Fcrit=8.021517,在显著性水平为5%时,Fcrit=4.256495,F=6.24,因为4.256495<6.24<8.021517,则工艺方法对灯泡寿命的影响是显著的。
2、因子B(灯丝配方)分析:
在显著性水平为1%的时候,Fcrit=8.021517,在显著性水平为5%时,Fcrit=4.256495,F=11.78731,因为8.021517<11.78731,则灯丝配方对灯泡的寿命影响是高度显著的。
3、交互作用分析:
在显著性水平为1%的时候,Fcrit=6.422085,在显著性水平为5%时,Fcrit=3.633089,F=4.583955,因为3.633089<4.583955<6.422085。
则工艺和菲方之间存在交互作用。
实验上机总结:
1、学会如何让运用软件进行方差计算和分析;
2、通过提出假设,了解如何通过计算数据进行显著性判断和检验;
3、根据假设和检验结果,明白如何进行判断。
实验上机成绩:
评阅老师:
评阅时间:
实验(上机)日期:
2013年5月16第3次
实验(上机)主题:
回归分析
实验(上机)类别):
验证性
完成方式:
独立
实验(上机)目的与要求:
1、搜集数据并建数据库
2、掌握一元线性回归的计算与分析
3、掌握多元线性回归的计算与分析
4、输出计算结果并进行分析
5、进行检验和预测
实验上机的内容及方法
一,一元线性回归
数据显示如下:
(表3-1十个企业的生产费用与产量数据)
企业编号
1
2
3
4
5
6
7
8
9
10
产量X(千克)
40
42
48
55
65
79
88
100
120
140
生产费用Y(千元)
150
140
160
170
150
162
185
165
190
185
将数据输入工作表,在“工具”菜单下选择“数据分析”,然后选择“回归”胆机确定。
在复选框中选择如下:
(图3-1一元回归分析复选框)
则显示相关数据处理结果如下:
表3-2回归统计表
MultipleR
0.807766
RSquare
0.652486
AdjustedRquare
0.609047
标准误差
10.5332
观测值
10
df
SS
MS
F
SignificanceF
回归分析
1
1666.514
1666.514
15.02064
0.004704
残差
8
887.586
110.9483
总计
9
2554.1
表3-3方差分析表
表3-4回归分析表
Coefficients
标准误差
tStat
P-value
Lower95%
Upper95%
Intercept
134.7893
8.643234
15.59477
2.85E-07
114.8579
154.7206
XVariable1
0.397821
0.102646
3.875647
0.004704
0.161118
0.634525
得到散点图和拟合分析图如下:
图3-2散点图
图3-3拟合分析图
相关分析:
1、回归方程
由散点图得知回归方程为一元线性方程。
得到回归方程如下:
Y=134.7893+0.397821X
2、显著性分析
得到MultipleR=0.807766>0.765(在检验数为0.01时相关系数检验数)表示回归方程显著。
tStat=3.875647>2.306(α=0.05,自由度=8时t值)则统计检验结果显著。
其存在良好的线性关系。
F=15.02064>5.32(在α=0.05,n1=1,n2=8时F值),表示回归结显著。
3、相关预测
在产量为80千件时,平均生产费用的置信区间(α=0.05)
生产费用预测Y0=134.7893+0.397821*80=166.615
下界=Y0-2.306*10.5332*0.317=166.614-7.707=158.844
下界=166.614+7.707=174.321
即总体均值得95%置信区间为(158.844,174.321)
在产量为80千件时,生产费用的置信区间(α=0.05)
生产费用预测Y0=134.7893+0.397821*80=166.615
下界=Y0-2.306*10.5332*1.049=166.614-25.503=140.637
下界=166.614+25.503=191.643
即总体得95%置信区间为(140.637,191.643)
二,多元回归
试验数据:
表3-5某企业10个月的月管理费用与工人劳动日数和机器开工台数的资料
管理费用Y
29
24
27
25
26
28
30
28
28
27
工人劳动日数X1
45
42
44
45
43
46
44
45
44
43
机器开工台数X2
16
14
15
13
13
14
16
16
15
15
将数据输入工作表,在“工具”菜单下选择“数据分析”,然后选择“回归”胆机确定。
在复选框中选择如下:
图3-4多元回归复选框
则显示相关数据处理结果如下:
表3-5回归统计表
回归统计
MultipleR
0.85377
RSquare
0.728923
AdjustedRSquare
0.651473
标准误差
1.070639
观测值
10
表3-6方差分析表
df
SS
MS
F
SignificanceF
回归分析
2
21.57613
10.78806
9.411471
0.010371
残差
7
8.023873
1.146268
总计
9
29.6
表3-7回归分析表
Coefficients
标准误差
tStat
P-value
下限95.0%
上限95.0%
Intercept
-13.8196
13.3233
-1.03725
0.334115
-45.3242
17.68497
XVariable1
0.56366
0.303274
1.858586
0.10543
-0.15347
1.280789
XVariable2
1.099469
0.313139
3.511123
0.009844
0.359013
1.839926
得到散点图和拟合分析图如下:
图3-5散点图
图3-6拟合分析图
相关分析:
1、回归方程
由散点图得知回归方程为二元线性方程。
得到回归方程如下:
Y=-13.8196+0.56366X1+1.099469X2
2、回归方程检验
RSquare=0.728923>0.6516
F=9.411471>4.74(α=0.05,自由度=2,7时,F值)
即:
回归方程的拟合程度很好。
3、回归系数:
t1=1.858586<2.365(α=0.05,自由度=7时,t值)
t2=3.511123>2.365(α=0.05,自由度=7时,t值)
所以β1不显著,β2显著。
即工人劳动日数对管理费用的影响并不是显著;机器开工台数对管理费用影响显著。
4、相关系数分析:
表3-8相关系数分析表
Y
X1
X2
Y
1
X1
0.501517
1
X2
0.771462
0.184094
1
则得到Y与X1之间的相关系数为0.501517;Y与X2之间的相关系数为0.771462,X1与X2之间的相关系数为0.184094
计算相应的偏回归系数Y与X1之间的偏相关系数为0.5748;Y与X2之间的相关系数为0.7987。
又t1=0.5748*√7/√(1-0.5748*0.5748)=1.86<2.356(α=0.05,自由度=7时,t值)
T2=0.7987*√7/√(1-0.7987*0.7987)=3.51>2.356(α=0.05,自由度=7时,t值)
即:
工人劳动日数与管理费用之间的偏相关系数不显著;机器开工台数与管理费用之间的偏相关系数是显著的。
实验上机总结:
1、学会如何让运用软件进行一元与二元方程回归分析的计算;
2、通过提出假设,了解如何通过计算数据进行系数显著性判断和检验;并对方程的拟合优度和相关性进行判断
3、根据回归结果很好的预测,并在给出置信度的情况下对总体均值和个体值进行预测。
实验上机成绩:
评阅老师:
评阅时间: