统计实验下要点.docx
《统计实验下要点.docx》由会员分享,可在线阅读,更多相关《统计实验下要点.docx(17页珍藏版)》请在冰豆网上搜索。
统计实验下要点
统计学
1.某公司有职工8000人,从中随机抽取406人调查其每月工资收入状况。
调查数据存放在Ex5_1数据库中。
(1)计算被调查职工的月平均工资B。
A.2959.562B.2969.562C.2979.562D.2989.562
(2)计算被调查职工的月工资收入的标准差A。
A.849.8272B.859.8272C.869.8272D.879.8272
(3)月收入在2500元及以上职工人数B。
A.256B.257C.258D.259
(4)试以95.45%的置信水平推断该公司职工月平均工资所在的范围D。
A.2857.377-3081.746B.2867.377-3071.746
C.2877.377-3061.746D.2887.377-3051.746
(5)试以95.45%的置信水平推断月收入在2500元及以上职工在全部职工中所占的比重C。
A.56.89%-70.20%B.57.89%-69.20%
C.58.89%-68.20%D.59.89%-67.20%
2.
和
分别表示下肢瘫痪和正常成年男子的血液容量,单位ml,假设
服从
,
服从
。
对
做了7次观测,结果是1612,1352,1456,1222,1560,1456,1924,对
做了10次观测,1082,1300,1092,1040,910,1248,1092,1040,1092,1288。
求
的95%置信区间。
所以
的95%置信区间为(214.29593,572.33264)
3.一农场种植葡萄以生产果冻,假设葡萄的甜度为
,服从正态分布
,从27卡车葡萄中,随机的抽取样本,每辆车取一个,然后测量甜度,结果如下:
16.015.212.016.914.416.315.612.915.3
15.815.512.514.514.915.116.012.514.3
15.413.012.614.915.115.312.417.214.8
(1)求葡萄平均甜度
的95%置信区间和单侧置信区间。
(2)分别求葡萄甜度方差
和标准差
的95%置信区间。
单方差检验和置信区间:
C1
方法
卡方方法仅适用于正态分布。
Bonett方法适用于任何连续分布。
统计量
变量N标准差方差
C1271.452.10
95%置信区间
标准差置信方差置信区
变量方法区间间
C1卡方(1.14,1.99)(1.30,3.95)
Bonett(1.18,1.91)(1.40,3.66)
所以μ的95%置信区间为(14.108,15.255)
甜度方差
的置信区间为(1.30,3.95);标准差的置信区间为(1.14,1.99)
4.生物学家要比较某种蜘蛛的雌、雄蜘蛛的体长,以
和
分别表示雌、雄蜘蛛的的体长,
和
分别表示
和
的均值;研究者分别测量了30个雌、雄蜘蛛,数据如下。
求
的95%大样本置信区间。
X:
5.204.705.757.506.456.554.704.805.955.206.356.955.706.205.406.205.856.805.655.505.655.855.756.355.755.955.907.006.105.80
Y:
8.259.95.907.058.457.559.8010.856.607.558.109.106.109.308.757.007.808.009.006.308.358.708.007.509.508.307.058.307.959.60
组统计量
VAR00001
N
均值
标准差
均值的标准误
VAR00002
X
30
5.9167
.66324
.12109
Y
29
8.1655
1.20787
.22430
的95%置信区间为(-2.75457,-1.74314)
5.X和Y分别表示某种录音唱片和高密磁碟的录音时间,假设
服从
,
服从
,现在从X和Y中分别随机抽取了9个和13个,测得录音时间如下
X:
40.8343.1835.7238.6837.1739.7524.7634.5833.98
Y:
42.8264.4256.9239.9272.3847.2664.5838.2072.7539.0939.0733.7062.02
求
的95%置信区间。
的95%置信区间为(0.015827,0.406397)
6.经验表明,一个矩形的宽与长之笔等于0.618时会给人比较良好的感觉。
某工艺品工厂生产的矩形工艺品框架的宽与长比例要求也按这一比率设计。
假定其总体服从正态分布,现随机抽取了20个框架测得比值分别为:
0.699
0.749
0.654
0.670
0.612
0.672
0.615
0.606
0.690
0.628
0.668
0.611
0.606
0.609
0.601
0.553
0.570
0.844
0.576
0.933
在显著性水平0.05时能否认为该厂生产的工艺品框架的宽与长的平均比率为0.618?
H0:
该厂生产的工艺品框架的宽与长的平均比率为0.618
H1:
该厂生产的工艺品框架的宽与长的平均比率不为0.618
列1
平均
0.6583
TINV(0.05,19)
2.09302405
标准误差
0.020855783
SQRT(19)
4.35889894
中位数
0.6215
S/SQRT(19)
0.02139758
众数
0.606
0.04478565
标准差
0.093269897
置信区间:
0.61351435
0.703086
方差
0.008699274
峰度
3.362449574
偏度
1.777452646
区域
0.38
最小值
0.553
最大值
0.933
求和
13.166
观测数
20
置信度(95.0%)
0.043651655
Z0.05=1.65故接受原假设,即在显著性水平0.05时能认为该厂生产的工艺品框架的宽与长的平均比率为0.618
7.某教师去年所授4个班共207人的“统计学”课程平均成绩为82分。
今年该教师进行了本课程较成功地教学改革,于是声称今年自己所授3个班共154人的该课程平均成绩将比去年高。
现在要求你对该教师的声称进行假设检验(
=0.05)。
Ex6_1是今年该教师所授本课程3个班级中随机抽取的已批阅36份学生试卷(假设考试已结束)。
(1)你所选取的原假设最好是(A)
A.u≤82B.u≥82C.u<82D.u>82
(2)你计算出的
=(D)
A.1.711563B.1.892153C.1.435912D.1.798658
(3)你计算出的P-值=()
A.0.050121B.0.041732C.0.040351D.0.042001
(4)你得到的结论是(D)
A.拒绝u≥82B.无理由拒绝u≤82C.拒绝u<82D.接受u>82
(5)若选用
=0.01,你得到的结论是(D)
列1
列1
平均
87.25
平均
87.25
标准误差
2.918842726
标准误差
2.918842726
中位数
95.5
中位数
95.5
众数
98
众数
98
标准差
17.51305635
标准差
17.51305635
方差
306.7071429
方差
306.7071429
峰度
3.091897352
峰度
3.091897352
偏度
-1.918755726
偏度
-1.918755726
区域
67
区域
67
最小值
33
最小值
33
最大值
100
最大值
100
求和
3141
求和
3141
观测数
36
观测数
36
最大
(1)
100
最大
(1)
100
最小
(1)
33
最小
(1)
33
置信度(95.0%)
5.925565759
置信度(99.0%)
7.95036013
A.拒绝u≥82B.无理由拒绝u≤82C.拒绝u<82D.接受u>82
8.一个以减肥为主要目的的健美俱乐部声称,参加他们的训练至少可使肥胖者减少17斤,为了验证,调查人员随机抽取了10名参加者,得到他们的体重记录,在显著性水平为0.05的情况下,调查结果是否支持俱乐部的说法?
训练前
189
202
220
207
194
177
193
202
208
233
训练后
170
179
203
192
172
161
174
187
186
204
(提示:
可以用Excel中分析工具中的“t-检验:
成对双样本均值分析”)
t-检验:
成对双样本均值分析
189
170
平均
204
184.2222222
方差
260
204.4444444
观测值
9
9
泊松相关系数
0.96018351
假设平均差
17
df
8
tStat
1.789140667
P(T<=t)单尾
0.055692794
t单尾临界
1.859548033
P(T<=t)双尾
0.111385587
t双尾临界
2.306004133
单侧置信区间
1.80385524
1.915240827
双侧置信区间
2.194618546
2.41738972
假设:
H0:
μ=17H1>17Z=-0.29
显著性水平α=0.05,则由标准正态分布表,得Z0.05=1.65,从而接受H0。
故在显著性水平为0.05的情况下,不能认为参加他们的训练至少可使肥胖者减少17斤
9.为比较新旧两种肥料对产量的影响,以便决定是否采用新肥料,研究者选择了面积相等,土壤等条件相同的40块田地,分别施用新旧两种肥料,得到的产量数据如下:
旧肥料
新肥料
109
101
97
98
100
105
109
110
118
109
98
98
94
99
104
113
111
111
99
112
103
88
108
102
106
106
117
99
107
119
97
105
102
104
101
110
111
103
110
119
取显著性水平为0.05,
(1)新肥料获得的平均产量是否显著高于旧肥料?
假定条件为:
两种肥料产量的方差未知但相等。
两种肥料产量的方差未知且不相等。
(2)两种肥料产量的方差是否有显著差异?
F-检验双样本方差分析
变量1
变量2
平均
109.9
100.7
方差
33.35789474
24.11578947
观测值
20
20
df
19
19
F
1.38323876
P(F<=f)单尾
0.243109655
F单尾临界
2.168251601
置信区间
1.925141946
2.411361257
故可认为两种肥料产量的方差有显著差异
10.Ex9_1中存放着在一项身高和体重的关系的研究中抽查的12个人的身高(单位:
厘米)和体重(单位:
公斤)的数据,以前的研究表明,人的体重和身高之间存在线性关系。
(1)计算体重和身高间的Pearson相关系数
为(C)。
A.0.9922B.0.8389C.0.6442D.-0.9922
相关:
C1,C2
C1和C2的Pearson相关系数=0.644
P值=0.024
(2)由第
(1)题计算的Pearson相关系数判断两者间的相关程度和相关方向为(D)。
A.高度负相关B.中度负相关C.高度正相关D.中度正相关
(3)假如要建立体重(因变量)对身高(自变量)的线性回归模型,求得其经验回归直线为(A)。
A.
B.
C.
D.
(4)检验回归系数是否为0即
则(B)。
(显著性水平
)
A.
回归系数
B.
回归系数
C.
回归系数
D.
回归系数
(5)该线性回归模型的可决系数为(D)。
A.0.9900B.0.8326C.0.6667D.0.4150
10题图及相关数据:
方差分析
来源自由度AdjSSAdjMSF值P值
回归112341234.17.090.024
C2112341234.17.090.024
误差101740174.0
合计112974
模型汇总
R-sq(调
SR-sq整)R-sq(预测)
13.190541.50%35.65%20.32%
系数
系数标方差膨
项系数准误T值P值胀因子
常量-119.069.2-1.720.116
C21.0820.4062.660.0241.00
回归方程
C1=-119.0+1.082C2
11.教材第九章第1题、第2题。
1.回归方程为
C2=-8.406+0.07813C1
S=4.07796R-Sq=97.3%R-Sq(调整)=96.9%
方差分析
来源自由度SSMSFP
回归13632.833632.83218.450.000
误差699.7816.63
合计73732.61
回归统计
MultipleR
0.986117516
RSquare
0.972427755
Adjusted
0.966913306
标准误差
4.102114221
观测值
7
相关系数:
0.986543671
答:
相关图如上,销售额与销售利润呈正相关;相关系数为0.986543671,自变量为产品销售额(C1),因变量为销售利润(C2),拟合直线回归方程为C2=-8.406+0.07813C1;在一定水平情况下,销售利润随着销售额的增加而增加;回归标准误差为4.102114221;在95%的置信水平下,当销售额为1200万元时销售利润的置信区间为(71.61501,99.07542)
2.回归方程为
C2=170.4-0.6978C1
S=4.65752R-Sq=96.7%R-Sq(调整)=96.3%
方差分析
来源自由度SSMSFP
回归15128.065128.06236.400.000
误差8173.5421.69
合计95301.60
回归统计
MultipleR
0.987499
RSquare
0.975154
Adjusted
0.971604
标准误差
3.783166
观测值
9
相关系数:
-0.9835
答:
相关图如上,产量与单位生产费用之间负相关;相关系数为-0.9835;自变量为产量(c1),因变量为单位生产费用(c2),拟合直线为回归方程为C2=170.4-0.6978C1;回归标准误差为3.78166,在95%的置信水平下,当产量为130万件时单位生产费用置信区间为(67.17851,92.22668).
12.Ex12_1中的数据库存放着2004年居民消费价格指数,分为全国、城市与农村三项。
每个总指数是通过综合八个类指数得到的,以上年为100。
(1)根据给出的权数,计算城市的“交通和通信”类指数,该指数为:
97.90%
(2)根据给出的权数,计算城市的居民消费价格指数,该指数为:
103.29%
(3)农村“交通和通信”类指数为99.77,意味着(D)。
A.在该项目上,物价上涨了2.3‰。
与去年比,购买同样的项目,支出增加。
B.在该项目上,物价上涨了2.3‰。
与去年比,购买同样的项目,支出减少。
C.在该项目上,物价下跌了2.3‰。
与去年比,购买同样的项目,支出增加。
D.在该项目上,物价下跌了2.3‰。
与去年比,购买同样的项目,支出减少。
(4)一个农民去年花费在“交通和通信”上是50元,如果维持去年的消费项目,他今年需要支付(D)。
A.50.12元B.49.12元C.50.88元D.49.88元