统计学.docx
《统计学.docx》由会员分享,可在线阅读,更多相关《统计学.docx(23页珍藏版)》请在冰豆网上搜索。
![统计学.docx](https://file1.bdocx.com/fileroot1/2023-1/4/a28c5ea1-a84f-4f96-80e3-57650a05ce5d/a28c5ea1-a84f-4f96-80e3-57650a05ce5d1.gif)
统计学
实验报告册
课程名称:
统计学
班级:
09财务管理2班
姓名:
李臣
学号:
095722029
学号:
095722029姓名:
李臣实验成绩:
实验一:
数据的图表展示
实验时间:
2011年4月26日第1-2节
实验地点:
公共实验室2
一、数据透视表的制作
根据教材P47页例3.2的原始资料资料(见实验一数据1)创建数据透视表
(1)实验要求:
编制如图3-12(P49)所示的数据透视表
(2)实验步骤:
参考教材P48-49
第1步:
在Excel工作表中建立数据清单
第2步:
选中数据清单中的任意单元格,并选择【数据】菜单中的【数据透视表和数据透视图】
第3步:
确定数据源区域
第4步:
在【向导—3步骤之3】中选择数据透视表的输出位置。
然后选择【布局】
第5步:
在【向导—布局】对话框中,依次将”分类变量“拖至左边的“行”区域,上边的“列”区域,将需要汇总的“变量”拖至“数据区域”
第6步:
然后单击【确定】,自动返回【向导—3步骤之3】对话框。
然后单击【完成】,即可输出数据透视表
(3)实验结果:
家庭所在地区
性别
买衣物首选因素
数据
大型城市
乡镇地区
中小城市
总计
男
价格
求和项:
平均月生活费(元)
1100
1800
400
3300
求和项:
月平均衣物支出(元)
230
180
40
450
款式
求和项:
平均月生活费(元)
500
3000
3500
求和项:
月平均衣物支出(元)
150
800
950
品牌
求和项:
平均月生活费(元)
1000
800
1600
3400
求和项:
月平均衣物支出(元)
300
240
480
1020
男求和项:
平均月生活费(元)
2600
2600
5000
10200
男求和项:
月平均衣物支出(元)
680
420
1320
2420
女
价格
求和项:
平均月生活费(元)
700
400
2600
3700
求和项:
月平均衣物支出(元)
230
120
465
815
款式
求和项:
平均月生活费(元)
2100
1100
3200
求和项:
月平均衣物支出(元)
600
330
930
品牌
求和项:
平均月生活费(元)
500
800
1300
求和项:
月平均衣物支出(元)
50
80
130
女求和项:
平均月生活费(元)
3300
1200
3700
8200
女求和项:
月平均衣物支出(元)
880
200
795
1875
求和项:
平均月生活费(元)汇总
5900
3800
8700
18400
求和项:
月平均衣物支出(元)汇总
1560
620
2115
4295
二、频数分布表的编制
(一)使用Excel数据透视表
根据教材P51页例3.3的原始资料资料(见实验一数据2—透视表数据)编制频数分布表
(1)实验要求:
使用数据透视表编制一张如表3-4(P52)的频数分配表
(2)实验步骤:
参考教材P48-50
第1步:
选择【数据】菜单中的【数据透视表和数据透视图】
第2步:
确定数据源区域
第4步:
在【向导—3步骤之3】中选择数据透视表的输出位置。
然后选择【布局】
第5步:
在【向导—布局】对话框中,依次将“分类变量“(这里是饮料品牌)连续拖放两次:
一次拖至左边的“行”区域,一次拖至“数据”区域
第6步:
然后单击【确定】,自动返回【向导—3步骤之3】对话框。
然后单击【完成】,即可输出数据透视表
(3)实验结果:
计数项:
饮料类型
顾客性别
饮料类型
男
女
总计
果汁
1
5
6
矿泉水
6
4
10
绿茶
7
4
11
其他
2
6
8
碳酸饮料
6
9
15
总计
22
28
50
(二)使用FREQUENCY函数或直方图工具
根据教材P51页例3.3的原始资料资料(见实验一数据2—直方图与函数数据)编制频数分布表
(1)实验要求:
使用Excel中的FREQUENCY函数或直方图工具编制一张频数分配表
(2)实验步骤:
参考教材P64
第1步.选择与接受区域相临近的单元格区域,作为频数分布表输出的区域
第2步.选择统计函数中的【FREQUENCY】函数
第3步.在对话框【Date-array】输入数据区域,在【Bins-array】输入接受区
第4步.同时按下“ctrl-shift-Enter”组合键,即得到频数分布.
(3)实验结果:
需要对输出结果进行必要的编制
接收
频率
累积%
果汁
6
12.00%
矿泉水
10
32.00%
碳酸饮料
15
62.00%
绿茶
11
84.00%
其他
8
100.00%
其他
0
100.00%
三、茎叶图的制作
根据教材P61页例3.6的原始资料资料(见实验一数据3.sav)制作茎叶图
(1)实验要求:
使用SPSS的制作茎叶图
(2)实验步骤:
参考教材P64
第1步:
选择【Analyze】下拉菜单,并选择【Descriptivestatistics-Explore】选项进入主对话框
第2步:
在主对话框中将变量选入【Variables】,点击【Plots】,在对话框中选择【Stem-and-leaf】(根据需要可选【Histogram】以给出直方图)。
点击【Continue】回到主对话框。
点击【OK】
(3)实验结果:
:
销量Stem-and-LeafPlot
FrequencyStem&Leaf
3.0014.134
1.0014.9
5.0015.02334
4.0015.5689
8.0016.00112334
8.0016.55567888
13.0017.0112222233444
14.0017.55556677888999
7.0018.0012234
13.0018.5667777888999
6.0019.001244
11.0019.55666667788
5.0020.01233
5.0020.56789
6.0021.001134
2.0021.58
1.0022.3
3.0022.568
4.0023.3344
1.00Extremes(>=237)
Stemwidth:
10.00
Eachleaf:
1case(s)
四、箱线图的制作
根据教材P68页例3.7的原始资料资料(见实验一数据4.sav)制作箱线图
(1)实验要求:
使用SPSS的制作多批数据箱线图
(2)实验步骤:
参考教材P69
学号:
095722029姓名:
李臣实验成绩:
实验二:
数据的描述统计
68
89
88
84
86
87
75
73
72
68
75
82
97
58
81
54
79
76
95
76
71
60
90
65
76
72
76
85
89
92
64
57
83
81
78
77
72
61
70
81
1.实验内容:
某班40名学生的考试成绩数据如下:
学校规定:
60分以下为不及格,60~70分为及格,70~80分为中,80~90分为良,90~100分为优.
2.要求:
使用Excel或SPSS软件完成如下内容:
(1)用FREQUENCY函数将该班学生分为不及格,及格,中,良,优五组,编制一张次数分配表;
(2)采用描述统计工具计算该未分组数据的描述统计的相关指标;
(选择分析工具库中的描述统计工具)
(3)使用分组数据计算相关的指标;
依据分组表计算:
均值,方差,标准差,标准误差,众位,中位数
(4)对(3)和(4)的结果进行比较分析,看结论是否一致。
3.实验过程:
参考实验指导过程
附:
(1)使用SPSS中的相关工具完成数据分组※;
对资料进行分组:
Transform-Recode-IntoDifferentVariable
(2)使用SPSS对分组后的数据计算描述统计的相关指标※
对已分组的资料进行频数分析
对频数进行加权Data-WeightCases
求分组数据的频数分析表和描述统计量
Analyze-DescriptiveStatistics-Frequencies
实验结果:
(分别选用SPSS工具和EXCEL的描述统计工具)
(1):
按成绩分组
人数
60以下
3
60-70
6
70-80
15
80-90
12
90以上
4
合计
40
Statistics
68
平均
76.79487
标准误差
1.71332
中位数
76
众数
76
标准差
10.69968
方差
114.4831
峰度
-0.43916
偏度
-0.26523
区域
43
最小值
54
最大值
97
求和
2995
观测数
39
最大
(1)
97
最小
(1)
54
Statistics
组别
N
Valid
40
Missing
0
组别
Frequency
Percent
ValidPercent
CumulativePercent
Valid
60以下
3
7.5
7.5
7.5
60-70
6
15.0
15.0
22.5
70-80
15
37.5
37.5
60.0
80-90
12
30.0
30.0
90.0
90以上
4
10.0
10.0
100.0
Total
40
100.0
100.0
Statistics
CJFZ
N
Valid
40
Missing
0
Mean
77.0000
Median
77.5926(a)
Mode
75.00
Std.Deviation
10.66987
Variance
113.84615
Range
40.00
Minimum
55.00
Maximum
95.00
aCalculatedfromgroupeddata.
CJFZ
Frequency
Percent
ValidPercent
CumulativePercent
Valid
55.00
3
7.5
7.5
7.5
65.00
6
15.0
15.0
22.5
75.00
15
37.5
37.5
60.0
85.00
12
30.0
30.0
90.0
95.00
4
10.0
10.0
100.0
Total
40
100.0
100.0
学号:
095722029姓名:
李臣实验成绩:
实验三:
假设检验与方差分析
假设检验—实验内容与步骤
一、双样本等方差假设
实验内容:
甲、乙两台机床同时加工某种同类型的零件,已知两台机床加工的零件直径(单位:
cm)分别服从正态分布,并且有12=22。
为比较两台机床的加工精度有无显著差异,分别独立抽取了甲机床加工的8个零件和乙机床加工的7个零件,通过测量得到如下数据。
在=0.05的显著性水平下,样本数据是否提供证据支持“两台机床加工的零件直径不一致”的看法?
(数据见假设检验数据1)
实验步骤:
参考实验指导
结果输出与分析:
t-检验:
双样本等方差假设
变量1
变量2
平均
19.925
20.14285714
方差
0.216428571
0.272857143
观测值
8
7
合并方差
0.242472527
假设平均差
0
df
13
tStat
-0.854848035
P(T<=t)单尾
0.204056849
t单尾临界
1.770933383
P(T<=t)双尾
0.408113698
t双尾临界
2.160368652
H0:
U1-U2=0H1:
U1-U2≠0a=0.05n1=8n2=7
t=-0.854848035<0,不能拒绝H0,没有证据表明两台机床加工的零件直径不一致
二、双样本异方差假设
实验内容:
“多吃谷物,将有助于减肥。
”为了验证这个假设,随机抽取了35人,询问他们早餐和午餐的通常食谱,一类为经常的谷类食用者(n1),一类为非经常谷类食用者(n2)。
然后测度每人午餐的大卡摄取量。
经过一段时间的实验,得到如右结果:
检验该假设(=0.05)(数据见假设检验数据2)
实验步骤:
参考实验指导和教材P230例11
结果输出与分析:
t-检验:
双样本异方差假设
变量1
变量2
平均
583
629.25
方差
2431.428571
3675.460526
观测值
15
20
假设平均差
0
df
33
tStat
-2.486888876
P(T<=t)单尾
0.009059379
t单尾临界
1.692360258
P(T<=t)双尾
0.018118757
t双尾临界
2.034515287
H0:
u1-u20H1:
u1-u2<0a=0.05n1=15,n2=20
t=-2.486888876拒绝H0,多吃谷物将有助于减肥。
三、成对双样本均值假设
实验内容:
一个以减肥为主要目标的健美俱乐部声称,参加其训练班至少可以使减肥者平均体重减重8.5kg以上。
为了验证该宣称是否可信,调查人员随机抽取了10名参加者,得到他们的体重记录如下表:
在=0.05的显著性水平下,调查结果是否支持该俱乐部的声称?
(数据见假设检验数据3)
实验步骤:
参考实验指导和教材P235例10.15
结果输出与分析:
t-检验:
成对双样本均值分析
训练前
训练后
平均
101.25
91.4
方差
63.40277778
50.48888889
观测值
10
10
泊松相关系数
0.963753015
假设平均差
8.5
df
9
tStat
1.941268615
P(T<=t)单尾
0.042068932
t单尾临界
1.833112923
P(T<=t)双尾
0.084137865
t双尾临界
2.262157158
H0:
u1–u2≤8.5H1:
u1–u2>8.5a=0.05df=10-1=9
T=1.941268615拒绝H0,该俱乐部的宣称可信。
方差分析—实验内容与步骤(EXCEL)
一、单因素方差分析(参考教材P276)
实验内容:
教材例10.1
实验步骤:
①将数据输入工作表中
②选择菜单“工具”—“数据分析”,打开“数据分析”对话框
③选择其中的“方差分析:
单因素方差分析”,打开对话框
4正确填写相关信息后,点“确定”。
输出结果与分析:
SUMMARY
组
观测数
求和
平均
方差
列1
7
343
49
116.6667
列2
6
288
48
184.8
列3
5
175
35
108.5
列4
5
295
59
162.5
方差分析
差异源
SS
df
MS
F
P-value
Fcrit
组间
1456.609
3
485.5362
3.406643
0.038765
3.12735
组内
2708
19
142.5263
总计
4164.609
22
H0:
u1=u2=…=ui=…=ukH1:
u1(i=1,2,…,k)不全相等F>Fa,所以拒绝原假设,
表明行业对投诉次数的影响是显著的。
二、双因素方差分析(无交互作用)(参考教材P285)
实验内容:
教材例10.3
实验步骤:
参考单因素方差分析
输出结果与分析:
方差分析:
无重复双因素分析
SUMMARY
观测数
求和
平均
方差
行1
5
1721
344.2
233.7
行2
5
1739
347.8
295.7
行3
5
1685
337
442.5
行4
5
1424
284.8
249.2
列1
4
1356
339
1224.667
列2
4
1321
330.25
1464.25
列3
4
1357
339.25
822.9167
列4
4
1273
318.25
1538.917
列5
4
1262
315.5
241.6667
方差分析
差异源
SS
df
MS
F
P-value
Fcrit
行
13004.55
3
4334.85
18.10777
9.46E-05
3.490295
列
2011.7
4
502.925
2.100846
0.143665
3.259167
误差
2872.7
12
239.3917
总计
17888.95
19
H0:
u1,u2,u3,u4全相等H1:
u1,u2,u3,u4不全相等,F表明不能认为地区对销售量有显著影响。
三、双因素方差分析(有交互作用)(参考教材P290)
实验内容:
教材例10.5
实验步骤:
①选择“工具”下拉菜单,并选择【数据分析】选项
②在分析工具中选择【方差分析:
可重复双因素分析】,然后选择【确定】
③当对话框出现时
在【输入区域】方框内键入数据区域(A1:
C11)
在【】方框内键入0.05(可根据需要确定)
在【每一样本的行数】方框内键入重复试验次数(5)
在【输出区域】中选择输出区域
选择【确定】
输出结果与分析:
方差分析:
可重复双因素分析
SUMMARY
路段1
路段2
总计
高峰
观测数
5
5
10
求和
127
105
232
平均
25.4
21
23.2
方差
1.3
2.5
7.066667
非高峰
观测数
5
5
10
求和
97
76
173
平均
19.4
15.2
17.3
方差
5.3
6.7
10.23333
总计
观测数
10
10
求和
224
181
平均
22.4
18.1
方差
12.93333
13.43333
方差分析
差异源
SS
df
MS
F
P-value
Fcrit
样本
174.05
1
174.05
44.06329
5.7E-06
4.493998
列
92.45
1
92.45
23.40506
0.000182
4.493998
交互
0.05
1
0.05
0.012658
0.911819
4.493998
内部
63.2
16
3.95
总计
329.75
19
H0:
μ1=…μi=…=μk;H1:
μi(i=1,2…k)不全相等,用于检验“时段”的P-value=0.0000μ1=…μj=…=μr;H1:
μj(i=1,2…r)不全相等,用于检验“路段”的P-value=0.0002a=0.05,因此不拒绝原假设,没有证据表明时段和路段的交互作用对行车时间有显著影响。
学号:
095722029姓名:
李臣实验成绩:
实验四:
相关与回归分析
某产品的产量和单位成本的关系如下:
月份
1
2
3
4
5
6
产量(千件)
2
3
4
3
4
5
单位成本(元/件)
73
72
71
73
69
68
要求:
(1)判断产量和单位成本之间的相关关系
(2)估计单位成本对产量的回归直线,并解释每个参数的实际含义
(3)当产量为6000件时,单位成本的理论值为多少?
(4)计算估计标准误差
(5)对线型关系进行假设检验(a=0.05)
(6)对回归系数进行假设检验(a=0.05)
实验步骤:
参考给定的实验步骤
将原始数据输入到Excel工作表的B2:
C7单元格。
然后按下列步骤进行操作:
(1):
选择“工具”下拉菜单
(2):
选择“数据分析”选项
(3):
在分析工具中选择“回归”,然后选择“确定”
(4):
当对话框出现时
在“Y值输入区域”方框内键入B2:
B7
在“X值输入区域”方框内键入C2:
B7
在“输出选项”中选择输出区域,选择D3
SUMMARYOUTPUT
回归统计
MultipleR
0.909091
RSquare
0.826446
Ad