第四章数据的描述性分析Word格式文档下载.docx
《第四章数据的描述性分析Word格式文档下载.docx》由会员分享,可在线阅读,更多相关《第四章数据的描述性分析Word格式文档下载.docx(25页珍藏版)》请在冰豆网上搜索。
单 价
(元)
销售额(元)
甲菜场
乙菜场
A
B
C
2.5
2.8
3.5
2200
1950
1500
1650
3000
试计算比较两个菜场价格的高低,并说明理由。
5.某班同学《统计学》成绩资料如下:
统计学成绩(分)
学生人数(人)
90-100
5
7
8
20
14
6
根据上述资料计算平均成绩、标准差及标准差系数。
6.根据下表资料,试用动差法计算偏度系数和峰度系数,并说明其偏斜程度和峰度:
日产量分组(只)
工人数(人)
35-45
45-55
55-65
65-75
10
15
7、计算5、13、17、29、80和150这一组数据的算术均值、调和均值和几何均值,并比较它们之间的大小。
8、根据2005年江苏省52个县市人均地区生产总值,进行如下计算:
(1)计算江苏省52个县市的平均人均地区生产总值是多少元?
1分
A:
20725B:
18674C:
15721D:
19711E:
85124
(2)计算江苏省52个县市人均地区生产总值的标准差是多少?
1分
36023B:
11969C:
9837D:
5632E:
21773
(3)江苏省52个县市人均地区生产总值的中位数是多少?
6923B:
4292C:
13119D:
5798E:
14992
(4)江苏省52个县市人均地区生产总值的偏态系数是多少?
0.55B:
-1.23C:
2.56D:
2.48E:
-0.10
(5)江苏省52个县市人均地区生产总值的峰度系数是多少?
8.92B:
-5.28C:
2.02D:
6.57E:
-0.54
(6)计算江苏省52个县市人均地区生产总值的全距是多少?
10964B:
108647C:
108586D:
32948E:
25124
(7)根据斯透奇斯规则对52个县市数据进行分组,组数是多少?
9B:
5C:
7D:
6E:
8
(8)若采用等距数列,根据组数和全距的关系,确定组距是多少?
18500B:
16300C:
29400D:
17000E:
23200
(9)人均地区生产总值在20600~36900元之间的县市个数是多少?
35B:
8C:
5D:
(10)人均地区生产总值大于20600元的县市个数占全部县市比例是?
32.7%B:
20.2%C:
25.0%D:
15.6%E:
28.8%
第五章指数
1.某商场三种商品的价格和销售量资料如下表所示:
商品名称
单位
价格(元)
销售量(千)
基期
报告期
皮鞋
双
200
180
3
4
布上衣
件
60
5
呢帽
顶
10
12
1
1.1
要求计算:
(1)三种商品的个体价格指数(即价比);
(2)拉氏、派氏价格指数
(3)拉氏、派氏销售量指数
(4)用马艾公式计算价格指数
(5)用理想公式计算价格指数
2.某商店三种商品的销售量与销售额资料如下:
商 品
计 量
单 位
销 售 量
基期销售额
(万元)
基 期
甲
打
290
180
乙
只
160
220
丙
盒
500
540
150
计算三种商品销售量总指数和由于销售量变动对销售额的影响额。
3.根据指数之间的关系计算回答下列问题:
(1)某企业2005年产品产量比2004年增长了14%,生产费用增长了10.8%,问2006年产品单位成本变动如何?
(2)某公司职工人数增加7%,工资水平提高了8.4%,工资总额增长多少?
(3)商品销售额计划增长10%,而销售价格却要求下降10%,则销售量如何变化?
(4)价格调整后,同样多的货币少购买商品10%,问物价指数是多少?
4.某国制造业工人周工资和消费物价指数资料如下:
年份
平均周工资(美元)
消费物价指数(2000=100)
2001
105
2005
215
118
(1)按美元面值计算,2005年平均周工资比2001年增长了多少?
(2)考虑物价因素,2005年平均周工资比2001年增长了多少?
5.《联合国统计年鉴(1971年)》发表的世界出口贸易价格指数(1963=100)如下:
1965
1966
1967
1968
1969
1970
指数
103
104
108
112
《联合国统计年鉴(1978年)》发表的世界出口贸易价格指数(1970=100)如下:
1971
1972
1973
1974
1975
106
114
142
199
213
要求:
以1970年为基期,编制1965-1975年的世界出口贸易价格指数数列。
6.A5_2数据库中存放着2004年居民消费价格指数,分为全国、城市与农村三项。
每个总指数是通过综合八个类指数得到的,以上年为100。
(1)根据给出的权数,计算城市的“交通和通信”类指数(3分)
该指数为:
__________
(2)根据给出的权数,计算城市的居民消费价格指数。
(3分)
(3)农村“交通和通信”类指数为99.77,意味着()。
(2分)
A.在该项目上,物价上涨了2.3‰。
与去年比,购买同样的项目,支出增加。
B.在该项目上,物价上涨了2.3‰。
与去年比,购买同样的项目,支出减少。
C.在该项目上,物价下跌了2.3‰。
D.在该项目上,物价下跌了2.3‰。
(4)一个农民去年花费在“交通和通信”上是50元,如果维持去年的消费项目,他今年需要支付()。
A.50.12元
B.49.12元
C.50.88元
D.49.88元
第六章抽样与参数估计
1、某地区粮食播种面积共5000亩,按不重复抽样方法随机抽取了100亩进行实测。
调查结果,平均亩产为450公斤,亩产量的标准差为52公斤。
试以95%的置信度估计该地区粮食平均亩产量的区间。
2、某地对上年栽种一批树苗共3000株进行了抽样调查,随机抽查的200株树苗中有170株成活。
试以95.45%的概率估计该批树苗的成活率的置信区间和成活总数的置信区间。
3、某公司有职工3000人,现从中随机抽取60人调查其工资收入情况,得到有关资料如下:
月收入
800
900
950
1000
1050
1100
1200
工人数
6
7
9
10
8
7
4
(1)试以0.95的置信度估计该公司工人的月平均工资所在范围。
(2)试以0.9545的置信度估计月收入在1000元及以上工人所占比重。
4、对一批产品按不重复抽样方法抽选200件,其中废品8件。
又知道抽样总体是成品总量的1/20,当概率为95.45%时,可否认为这一批成品的废品率低于5%?
5、某企业从长期实践得知,其产品直径X是一随机变量,服从方差为0.05的正态分布。
从某日产品中随机抽取6个,测得其直径分别为14.8,15.3,15.1,15,14.7,15.1(单位:
厘米)。
在0.95的置信度下,试求该产品直径的均值的置信区间。
6、某厂对一批产品的质量进行抽样检验,采用重复抽样抽取样品200只,样本优质品率为85%,试计算当把握程度为95%时优质品率的区间范围。
7、检验某食品厂本月生产的10000袋产品的重量,根据上月资料,这种产品每袋重量的标准差为25克。
要求在95.45%的概率保证程度下,平均每袋重量的误差范围不超过5克,应抽查多少袋产品?
8、某企业对一批产品进行质量检验,这批产品的总数为5000件,过去几次同类调查所得的产品合格率为93%、95%和96%,为了使合格率的允许误差不超过3%,在99.73%的概率下应抽查多少件产品?
9、某广告公司为了估计某地区收看某个新电视节目的居民人数所占比重,设计了一个抽样方案。
如果该公司希望有95%的信心使所估计的比重只有2个百分点的误差,问样本量定为多少人较为合适?
10、某地区对居民用于某类消费品的年支出数额进行了一次抽样调查。
抽取了400户居民,调查得到的平均每户支出数额为350元,标准差为47元,支出额在600元以上的只有40户。
试以95%的置信度估计:
(1)平均每户支出额的区间;
(2)支出额在600元以上的户数所占比例的区间。
11.A6-7数据库中存放着某公司有职工8000人,从中随机抽取406人调查其每月工资收入状况的调查数据。
(1)计算被调查职工的月平均工资(1分)
(2)计算被调查职工的月工资收入的标准差(1分)
(3)月收入在2500元及以上职工人数(1分)
(4)试以95.45%的置信水平推断该公司职工月平均工资所在的范围(3分)
(5)月收入在2500元及以上职工在全部职工中所占的比重
(4分)
第七章假设检验
1.假定某厂生产一种钢索断裂强度为
,服从正态分布
,从中选取一容量为6的样本,得
,能否据此样本认为这批钢索的平均断裂强度为
?
2.从1997年的新生婴儿中随机抽取20名,测得其平均体重为3180g,样本标准差为300g,而从过去的统计资料知,新生婴儿的平均体重为3140g,问现在的新生婴儿的体重有否显著变化?
3.检查一批保险丝,抽取10根在通过强电流后熔化所需时间(s)为
42,65,75,78,59,71,57,68,54,55
问在
下能否认为这批保险丝的平均熔化时间不小于65s(设熔化时间服从正态分布)?
4.某种羊毛在处理前后各抽取样本,测得含脂率如下(%):
处理前19,18,21,30,66,42,8,12,30,27
处理后15,13,7,24,19,4,8,20
羊毛含脂率按正态分布,且知其处理前后标准差都是6,问处理前后含有无显著变化
5.在同一炼钢炉上进行改进操作方法后确定其得率是否有所变化的试验,用原方法和改进后的新方法各炼了10炉,其得率分别为
原方法:
78.1,72.4,76.2,74.3,77.4,78.4,76.0,75.5,76.7,77.3
新方法:
79.1,81.0,77.3,79.1,80.0,79.1,79.1,77.3,80.2,82.1
设两种方法得率相互独立且均服从同方差的正态分布,问新方法的得率是否有所提高
6.某企业声明有30%以上的消费者对其产品质量满意。
如果随机调查600名消费者,表示对该企业产品满意的有220人。
试在显著性水平0.05下,检验调查结果是否支持企业的自我声明。
7.某企业生产钢丝以往所得折断力的方差为25,现从某日产品中随机抽取10根检验折断力,得数据如下(单位:
kg):
578,572,570,568,572,570,570,572,596,584
设折断力服从正态分布,试在显著性水平0.05下,问该日生产钢丝折断力的方差是否有显著变化?
8.南京财经大学某教师去年所授4个班共207人的“统计学”课程平均成绩为82分。
今年该教师进行了本课程较成功地教学改革,于是声称今年自己所授3个班共154人的该课程平均成绩将比去年高。
现在要求你对该教师的声称进行假设检验(
=0.05)。
“样本1.xls”是今年该教师所授本课程3个班级中随机抽取的已批阅36份学生试卷(假设考试已结束)。
请问(每个问题计2分):
(1).你所选取的原假设最好是()
A.u≤82B.u≥82
C.u<
82D.u>
82
(2).你计算出的
=()
A.1.711563B.1.892153C.1.435912D.1.798658
(3).你计算出的p—值=()
A.0.050121B.0.041732C.0.040351D.0.042001
(4).你得到的结论是()
A.拒绝u≥82B.无理由拒绝u≤82
C.拒绝u<
82D.接受u>
82
(5).若选用
=0.01,你得到的结论是()
第八章非参数检验
1.赛马迷们会认为,在圆跑道上进行的赛马比赛中,某些起点位置上的马会特别有利。
在有八匹马的比赛中,位置1是内侧最靠近栏杆的跑道,位置8是外侧离栏杆最远的跑道。
请从赛马的结果中判断起点位置与赛马获胜是否有关。
(α=0.05)
起点位置
2
6
8
获胜次数
34
26
28
32
19
22
21
18
2.某地145个周岁儿童身高数据如下表所示,问该地区周岁儿童身高是否呈正态分布(α=0.05)?
身高
人数
68以下
68-70
11
70-72
36
72-74
49
74-76
76-78
16
78-80
80-82
82以上
3.某企业出台了一套改革方案,向不同工龄的职工进行调查得到下面的列联表,根据这张表能否认为不同工龄的职工对改革方案的态度是不同的?
态度
职工工龄
合计
10年以下
10-20年
20年以上
赞成
9
40
无所谓
14
反对
43
第九章方差分析
1.某公司请金环公告公司为促销某产品设计广告,为了评出三个备选方案中较好的一个,该公司对其所属的14家超级市场随机地配用了一种广告。
一个月之后,各超市的商品销售增长额资料如下表所示:
广告类型
配用超市数量
销售额
69,76,71,84
74,79,63,74,70
71,92,85,68,84
三种广告有差别吗?
2.比较3种化肥(A、B两种新型化肥和传统化肥)施撒在三种类型(酸性、中性和碱性)的土地上对作物的产量情况有无差别,将每块土地分成3块小区,施用A、B两种新型化肥和传统化肥。
收割后,测量各组作物的产量,得到的数据如下:
化肥
种类
土地
酸性
中性
碱性
30
31
传统
27
29
假定化肥类型与土地类别之间不存在交互效应。
问:
(1)化肥对作物产量有影响吗?
(2)土地类型对作物产量有影响吗?
3.某SARS研究所对31名自愿者进行某项生理指标测试,结果如下:
SARS患者
1.8
1.4
1.5
2.1
1.9
1.7
2.0
疑似者
2.3
2.6
2.5
2.4
非患者
2.9
3.2
2.7
2.8
3.0
3.4
3.3
3.5
(1)这三类人的该项生理指标有差别吗?
(2)如果有差别,请进行多重比较分析。
4.有40个学生入学成绩没有差异,现用5种不同的教学方法组织教学,每组8人。
期末考试成绩如下表,假定学生成绩服从正态分布,且具有方差齐性,问不同教学方法对学生成绩有无影响?
1.该方差分析的备择假设是:
2分
B
C.
不全相等
2.随机误差项SSE的自由度是:
A.4B.35C.39
3.检验统计量为(保留三位小数):
2分
4.结论是:
A.5种教学方法有差别B.5种教学方法无差别
5.如果想知道具体哪些教学方法有差异可采用什么方法?
第十章相关与回归分析
1.对10户居民家庭的月可支配收入和消费支出进行调查,得到资料如下:
(单位:
百元)
编号
1
5
消费支出
20
15
42
65
70
53
78
可支配收入
25
45
62
88
92
99
75
(1)画出相关图并判断消费支出与可支配收入之间的相关方向;
(2)计算消费支出与可支配收入的相关系数并说明其相关程度。
2.某公司8个所属企业的产品销售资料如下:
企业编号
产品销售额(万元)
销售利润(万元)
2
3
6
170
220
390
430
480
650
850
1000
8.1
12.5
18.0
22.0
26.5
40.0
64.0
69.0
(1)计算相关系数,测定产品销售额和利润之间的相关方向和相关程度;
(2)确定自变量和因变量,并求出直线回归方程;
(3)计算估计标准误差;
(4)根据回归方程,指出当销售额每增加1万元,利润额平均增加多少?
(5)在95%的概率保证下,当销售额为1200万元时利润额的置信区间。
3.对某一资料进行一元线性回归,已知样本容量为20,因变量的估计值与其平均数的离差平方和为585,因变量的方差为35,试求:
(1)可决系数;
(2)该方程的估计标准误差。
4.已知:
试求:
(1)相关系数r;
(2)回归系数
;
(3)估计标准误差。
5.某公司的10家下属企业的产量与生产费用之间关系如下:
产量/万件
48
55
79
140
生产费用/万元
170
162
185
165
190
(1)计算相关系数;
(2)拟合回归方程;
(3)计算估计标准误差
。
6.从某大学统计系的学生中随机抽取16人,对数学与统计学的考试成绩(单位:
分)进行调查,结果如下:
学生编号
数学成绩
统计学成绩
统计学
81
90
91
74
73
85
72
68
71
13
83
77
66
84
54
94
58
87
46
(1)计算数学成绩与统计学成绩之间的相关系数并说明关系密切程度;
(2)对相关系数的显著性进行检验(取
=0.05);
(3)拟合统计学成绩对数学成绩的回归直线。
2.12;
2.131;
2.145;
7.设有资料如下表所示:
甲、乙两位评酒员对10种品牌白酒的主观排序
品牌
2
试问两位评酒员的评审顺序是否具有一定的相关?
(按5%的显著水平检验)
8.文件data10-03中存放着在一项身高和体重的关系的研究中抽查的12个人的身高(单位:
厘米)和体重(单位:
公斤)的数据,以前的研究表明,人的体重和身高之间存在线性关系.
(1)计算体重和身高间的Pearson相关系数
为(),(3分)由此判断两者间的相关程度和相关方向为();
(1分)
A.高度负相关B.中度负相关C.高度正相关D.中度正相关
(2)假如要建立体重(因变量)对身高(自变量)的线性回归模型,求得其经验回归直线为();
A.
B.
C.
D.
(3分)
(3)检验回归系数是否为0即
则();
(显著性水平
)(2分)
A.
回归系数
C.
(4)该线性回归模型的可决系数为().(1分)
第十一章多元统计分析
请在EXCEL中完成以下各题。
1.某主管局管辖20个工厂,现要对每个工厂作经济效益分析,经研究确定从所取得的生产成果同