统计学实验报告Word格式文档下载.docx
《统计学实验报告Word格式文档下载.docx》由会员分享,可在线阅读,更多相关《统计学实验报告Word格式文档下载.docx(25页珍藏版)》请在冰豆网上搜索。
66
69
93
2.单击保存,在文件名称中输入“成绩文件”
3.加载数据分析工具:
在“工具”下拉菜单下找到“加载宏”,单击,选择“数据分析工具”点击确认。
图1-1加载分析工具库
4.再在工具下拉菜单下找到“数据分析”选项。
图1-2打开数据分析
5.单击“数据分析”,选择“描述性统计”
图1-3开始描述性统计
6.数据复选框如下,单击确定,
图1-4描述性统计选项卡
7.显示结果如下:
表1-2描述性指标显示结果
平均
77.91667
区域
标准误差
1.972982
最小值
中位数
最大值
众数
求和
2805
标准差
11.83789
观测数
36
方差
140.1357
最大
(1)
峰度
-0.24247
最小
(1)
偏度
-0.19707
置信度(95.0%)
4.005367
三、函数计算:
1、简单函数运算:
1)将鼠标定位在单元格,进入编写模式,输入函数:
“=A1*A1”,点击回车键,在哦单元格内出现运算结果。
把鼠标移到单元个右下角,直到出现“十字”按住鼠标右键往下拉,则将运算复制。
显示结果如下:
图1-4函数输入
2)插入函数:
(用函数求和)
3)单击输入框中的函数输入符号,点击确定(如下图),计算书刚刚输入成绩的总和为:
图1-5插入函数选项卡
按照同样的方法可以选择其他函数形式进行统计统计运算。
2、制作统计图:
1)直方图:
●在表格上输入分组方式:
表1-3分组方式
99
●在工具菜单下找到数据分析,单击,并在对话框中选择“直方图”,单击“确定”
图1-6直方图操作选项
图1-7直方图复选框
●统计结果如下:
表1-4频率分析表
分数
频率
3
8
11
7
其他
图1-8成绩分析直方图
●如果在复选框中选择“柏拉图”和“表格输出”,显示结果如下:
图1-9带累计频率的直方图
2)饼形图:
在“插入”菜单下,选择“图表”,在对话框中选择“饼形图”
图1-10饼形图选择框
根据向导输入数据,分别选择。
最终统计图表如下:
图1-11成绩分析饼形图
上机总结:
1、通过本次上机,巩固了excel的基本操作,让操作更加流畅。
2、进一步了解了函数的使用,能够熟练的掌握基本的统计量的运算。
3、通过实验的学习和比较,进一步加深了对统计量意义的学习。
实验(上机)成绩:
评阅老师:
评阅时间:
2013年5月9日第2次
假设检验与方差分析
1、建数据库:
(1)假设检验(双样本数据)
(2)方差分析:
单因素方差分析和双因素方差分析
2、掌握假设检验的计算与分析
3、掌握方差分析的计算与分析
4、输出计算结果并进行分析
5、进行检验和决策
实验上机内容及方法
一、单因素分析
1.检验数据:
表2-1三种训练方法下工人的日产量
人均日产量
方法1
15
18
19
22
方法2
27
21
17
方法3
24
16
2.将数据输入软件,并在“工具”菜单下选择“数据分析”,选择如图,单击“确认”
图2-1分析工具选择
3.在数据复选框内选择数据如下;
图2-2单因素分析复选框
结果输出:
表2-2单因素分析结果
组
行1
5
85
17.5
行2
105
15.5
行3
方差分析
差异源
SS
df
MS
F
P-value
Fcrit
组间
40
2
20
1.25
0.321277
3.885294
组内
192
12
总计
232
14
分析:
Fcrit=3.885294;
F=1.25
因为F=1.25<Fcrit=3.885294,所以拒绝训练方法对日产量有显著影响,即三种训练方法对日产量没有显著影响。
二、双因素分析(无交互作用)
实验数据
表2-34个工人和3台机器配合的日产量
B1
B2
B3
B4
A1
50
47
53
A2
54
57
A3
52
42
41
48
将数据输入软件,并在“工具”菜单下选择“数据分析”,选择如图,单击“确认”
图2-3无交互作用双因素分析选项
在数据复选框内选择数据如下;
图2-4无交互作用双因素分析复选框
分析结果输出:
表2-4方差分析:
无重复双因素分析
SUMMARY
4
197
49.25
8.25
183
45.75
26.91667
列1
165
55
列2
143
47.66667
36.33333
列3
145
48.33333
65.33333
列4
159
25
显著性水平:
1%
行
318.5
159.25
29.10152
0.000816
10.92477
列
114.6667
38.22222
6.984772
0.022015
9.779538
误差
32.83333
6
5.472222
466
方差分析:
5%
5.143253
4.757063
行因素:
在显著性水平为1%的时候,Fcrit=10.92477,在显著性水平为5%时,Fcrit=5.143253,都远小于F=29.10152。
即不同牌号机器上的日产量有高度显著性差别。
列因素:
在显著性水平为1%的时候,Fcrit=9.779538,在显著性水平为5%时,Fcrit=4.757063,F=6.984772。
因为4.757063<6.984772<9.779538。
则不同工人的日产量只有显著的差别。
三、双因素分析(有交互作用)
表2-5灯泡寿命数据
因子A
因
子
B
13.2
14.4
15.6
13.6
16.1
13.7
16.3
17.3
14.3
17.1
14.5
15.7
图2-5有交互作用双因素分析
图2-6有交互作用双因素分析复选框
表2-5方差分析:
可重复双因素分析
28.2
30
27.6
85.8
14.1
13.8
1.62
0.72
0.08
0.796
33.4
28
94.8
16.7
15.8
0.18
0.32
2.188
35
30.2
33.2
98.4
15.1
16.6
16.4
0.5
1.52
96.6
88.2
94.2
14.7
3.096
0.62
2.348
显著性水平为5%
样本
14.04
7.02
11.78731
0.003063
4.256495
6.24
3.12
5.238806
0.030987
交互
10.92
2.73
4.583955
0.027093
3.633089
内部
5.36
9
0.595556
36.56
显著性水平为:
8.021517
6.422085
1、因子A(工艺方法)分析:
在显著性水平为1%的时候,Fcrit=8.021517,在显著性水平为5%时,Fcrit=4.256495,F=6.24,因为4.256495<6.24<8.021517,则工艺方法对灯泡寿命的影响是显著的。
2、因子B(灯丝配方)分析:
在显著性水平为1%的时候,Fcrit=8.021517,在显著性水平为5%时,Fcrit=4.256495,F=11.78731,因为8.021517<11.78731,则灯丝配方对灯泡的寿命影响是高度显著的。
3、交互作用分析:
在显著性水平为1%的时候,Fcrit=6.422085,在显著性水平为5%时,Fcrit=3.633089,F=4.583955,因为3.633089<4.583955<6.422085。
则工艺和菲方之间存在交互作用。
实验上机总结:
1、学会如何让运用软件进行方差计算和分析;
2、通过提出假设,了解如何通过计算数据进行显著性判断和检验;
3、根据假设和检验结果,明白如何进行判断。
实验上机成绩:
2013年5月16第3次
回归分析
1、搜集数据并建数据库
2、掌握一元线性回归的计算与分析
3、掌握多元线性回归的计算与分析
5、进行检验和预测
实验上机的内容及方法
一,一元线性回归
数据显示如下:
(表3-1十个企业的生产费用与产量数据)
企业编号
1
10
产量X(千克)
65
88
100
120
140
生产费用Y(千元)
150
160
170
162
185
190
将数据输入工作表,在“工具”菜单下选择“数据分析”,然后选择“回归”胆机确定。
在复选框中选择如下:
(图3-1一元回归分析复选框)
则显示相关数据处理结果如下:
表3-2回归统计表
MultipleR
0.807766
RSquare
0.652486
AdjustedRquare
0.609047
10.5332
观测值
SignificanceF
1666.514
15.02064
0.004704
残差
887.586
110.9483
2554.1
表3-3方差分析表
表3-4回归分析表
Coefficients
tStat
Lower95%
Upper95%
Intercept
134.7893
8.643234
15.59477
2.85E-07
114.8579
154.7206
XVariable1
0.397821
0.102646
3.875647
0.161118
0.634525
得到散点图和拟合分析图如下:
图3-2散点图
图3-3拟合分析图
相关分析:
1、回归方程
由散点图得知回归方程为一元线性方程。
得到回归方程如下:
Y=134.7893+0.397821X
2、显著性分析
得到MultipleR=0.807766>0.765(在检验数为0.01时相关系数检验数)表示回归方程显著。
tStat=3.875647>2.306(α=0.05,自由度=8时t值)则统计检验结果显著。
其存在良好的线性关系。
F=15.02064>5.32(在α=0.05,n1=1,n2=8时F值),表示回归结显著。
3、相关预测
在产量为80千件时,平均生产费用的置信区间(α=0.05)
生产费用预测Y0=134.7893+0.397821*80=166.615
下界=Y0-2.306*10.5332*0.317=166.614-7.707=158.844
下界=166.614+7.707=174.321
即总体均值得95%置信区间为(158.844,174.321)
在产量为80千件时,生产费用的置信区间(α=0.05)
下界=Y0-2.306*10.5332*1.049=166.614-25.503=140.637
下界=166.614+25.503=191.643
即总体得95%置信区间为(140.637,191.643)
二,多元回归
试验数据:
表3-5某企业10个月的月管理费用与工人劳动日数和机器开工台数的资料
管理费用Y
29
26
工人劳动日数X1
45
44
43
46
机器开工台数X2
13
图3-4多元回归复选框
表3-5回归统计表
回归统计
0.85377
0.728923
AdjustedRSquare
0.651473
1.070639
表3-6方差分析表
21.57613
10.78806
9.411471
0.010371
8.023873
1.146268
29.6
表3-7回归分析表
下限95.0%
上限95.0%
-13.8196
13.3233
-1.03725
0.334115
-45.3242
17.68497
0.56366
0.303274
1.858586
0.10543
-0.15347
1.280789
XVariable2
1.099469
0.313139
3.511123
0.009844
0.359013
1.839926
图3-5散点图
图3-6拟合分析图
由散点图得知回归方程为二元线性方程。
Y=-13.8196+0.56366X1+1.099469X2
2、回归方程检验
RSquare=0.728923>0.6516
F=9.411471>4.74(α=0.05,自由度=2,7时,F值)
即:
回归方程的拟合程度很好。
3、回归系数:
t1=1.858586<2.365(α=0.05,自由度=7时,t值)
t2=3.511123>2.365(α=0.05,自由度=7时,t值)
所以β1不显著,β2显著。
即工人劳动日数对管理费用的影响并不是显著;
机器开工台数对管理费用影响显著。
4、相关系数分析:
表3-8相关系数分析表
Y
X1
X2
0.501517
0.771462
0.184094
则得到Y与X1之间的相关系数为0.501517;
Y与X2之间的相关系数为0.771462,X1与X2之间的相关系数为0.184094
计算相应的偏回归系数Y与X1之间的偏相关系数为0.5748;
Y与X2之间的相关系数为0.7987。
又t1=0.5748*√7/√(1-0.5748*0.5748)=1.86<2.356(α=0.05,自由度=7时,t值)
T2=0.7987*√7/√(1-0.7987*0.7987)=3.51>2.356(α=0.05,自由度=7时,t值)
工人劳动日数与管理费用之间的偏相关系数不显著;
机器开工台数与管理费用之间的偏相关系数是显著的。
1、学会如何让运用软件进行一元与二元方程回归分析的计算;
2、通过提出假设,了解如何通过计算数据进行系数显著性判断和检验;
并对方程的拟合优度和相关性进行判断
3、根据回归结果很好的预测,并在给出置信度的情况下对总体均值和个体值进行预测。