《数据模型与决策》习题解答 2Word格式文档下载.docx
《《数据模型与决策》习题解答 2Word格式文档下载.docx》由会员分享,可在线阅读,更多相关《《数据模型与决策》习题解答 2Word格式文档下载.docx(28页珍藏版)》请在冰豆网上搜索。
52.000
43.250
28.500
30.375
31.125
38.000
38.875
33.500
(1)构建频数分布*。
(2)分组,并绘制直方图,说明股价的规律。
(3)绘制茎叶图*、箱线图,说明其分布特征。
(4)计算描述统计量,利用你的计算结果,对普通股价进行解释。
解:
(1)将数据按照从小到大的顺序排列
1.25,7.625,8,8.625,8.75,9,9.25,9.25,9.375,10,11.375,11.5,14,16.5,16.625,18,18,18.5,19.375,21.625,24.25,28.5,29.625,29.625,30.375,31.125,32.25,33.5,33.625,34,35.25,37,37.875,38,38.875,43.25,48.375,52,53.375,79.375,结合
(2)建立频数分布。
(2)将数据分为6组,组距为10。
分组结果以及频数分布表。
为了方便分组数据样本均值与样本方差的计算,将基础计算结果也列入下表。
区间
组频数
累计频数
组中值
组频数×
组中值×
9
5
45
225
10
19
15
150
2250
24
25
125
3125
11
35
385
13475
2
37
90
4050
3
40
60
180
10800
合计
975
33925
根据频数分布与累积频数分布,画出频率分布直方图与累积频率分布的直方图。
频率分布直方图
从频率直方图和累计频率直方图可以看出股价的规律。
股价分布10元以下、10—20元、30—40元占到60%,股价在40元以下占87.5%,分布不服从正态分布等等。
累积频率分布直方图
(3)将原始数据四舍五入取到整数。
1,8,8,9,9,9,9,9,9,10,11,12,14,17,17,18,18,19,19,22,24,29,30,30,30,31,32,34,34,34,35,37,38,38,39,43,48,52,53,79
以10位数为茎个位数为叶,绘制茎叶图如下
茎(十位数)
叶(个位数及其小数)
1
249
89
4
38
23
6
7
由数据整理,按照从小到大的准许排列为:
最小值
,下四分位数
,中位数
,上四分位数
,最大值
,四分位数间距
,
因此可以做出箱线图为:
茎叶图的外部轮廓反映了样本数据的分布状况。
从茎叶图和箱线图可以看出其分布特征:
中间(上下四分位数部分)比较集中,但是最大值是奇异点。
数据分布明显不对称,右拖尾比较长。
(4)现用原始数据计算常用的描述性统计量
样本均值:
样本方差:
样本标准差:
用分组数据计算常用的描述性统计量:
与用原始数据计算的结果差别不大。
此外,可以用Excel中的数据分析直接进行描述性统计分析,结果如下:
平均
25.4219
区域
78.125
标准误差
2.5651
1.25
中位数
22.9375
最大值
众数
求和
1016.875
标准差
16.2233
观测数
方差
263.1961
最大
(1)
峰度
1.6025
最小
(1)
偏度
1.0235
置信度(95.0%)
5.1885
补充习题:
1.测量血压14次,记录收缩压,得样本如下:
121,123,119,130,125,115,128,126,109,112,120,126,125,125
求样本均值,样本方差,样本中位数,众数和极差。
2.根据列表数据
分组
人数
[20,25)
[25,30)
[30,35)
[35,40)
[40,45]
求样本均值,样本方差,样本标准差
3.调查30个中学生英语成绩,得样本如下:
54,66,69,69,72,75,77,75,76,79,76,77,78,79,81,
81,85,87,83,84,89,86,89,89,92,95,96,96,98,99
把样本分为5组,组距为10,且最小组的下限为50,作出列表数据和直方图
补充习题答案
排序:
109
112
115
119
120
121
123
126
128130
均值:
=121.71
方差:
=37.76
中位数:
=124
众数:
me=125
极差:
R=xn-x1=21
2.根据列表数据
22.5
27.5
32.5
37.5
42.5
解:
样本均值:
=31.59091
样本方差:
=25.32468
样本标准差:
=5.032
3调查30个中学生英语成绩,得样本如下:
列表
频数
[50,60)
[60,70)
[70,80)
[80,90)
[90,100]
第四章习题(p118)
21.下面的10个数据是来自一个正态总体的样本数据:
10,8,16,12,15,6,5,14,13,9
(1)总体均值的点估计是多少?
(2)总体标准差的点估计是多少?
(3)总体均值99%的置信区间是多少?
(1)总体均值的点估计
(2)总体标准差的点估计
(3)这是正态总体方差未知的条件下,总体均值
的区间估计问题
总体均值99%的置信区间为:
第五章习题(p154)
7.某一问题的零假设和备择假设分别如下:
当某个样本容量为100,总体标准差为12时,对下面每一个样本的结果,都采用显著性水平
计算检验统计量的值,并得出相应的结论。
(1)
。
(2)
(3)
(4)
这是总体分布未知,大样本前提下,总体均值的单边检验问题。
故,可以用大样本情况下单个总体均值的检验。
提出原假设与备择假设:
选择检验统计量
,当
成立时,
给定显著性水平
,拒绝域
,拒绝
接受
,即不能认为
,接受
即认为
12.有一项研究要作的假设检验是:
某个样本有6个数据,他们分别是:
20,18,19,16,17,18。
根据这6个数据,分别回答以下问题:
(1)它们的均值和标准差各是多少?
(2)当显著性水平
时,拒绝规则是什么?
(3)计算检验统计量t的值。
(4)根据以上信息,你所得出的结论是什么?
说明:
本题是小样本,应该有总体服从正态分布
的假定。
(1)由样本数据得
;
(2)在总体服从正态分布的假定之下,这是正态总体方差未知的条件下,总体均值的双边检验问题,用
检验。
选择检验统计量:
,当原假设
当显著性水平
时,
,因此:
拒绝域为:
(3)计算检验统计量t的值
即,总体均值
与20没有显著性差异。
13.一家钢铁企业主要生产一种厚度为25mm的钢板。
历史统计资料显示,其中一台设备生产的钢板的厚度服从正态分布。
最近,该厂维修部门对这台设备进行了大修。
这台设备重新投入生产后,车间生产监管员担心这台设备经过维修后生产的钢板厚度会发生变化。
为验证这一担心是否属实,他随机选出20块钢板,对其厚度进行测量。
测量结果如表5—11所示。
请判断这台设备经过维修后生产的钢板的厚度是否发生了明显的变化(
)。
表5—1120块样本钢板的厚度(单位:
mm)
22.6
22.2
23.2
27.4
24.5
27.1
26.6
28.1
26.9
24.9
26.2
25.3
23.1
24.2
26.1
25.8
30.4
28.6
23.5
23.6
这是一个正态总体方差未知的条件下,总体均值的双边检验问题。
用
(!
)提出原假设和备择假设:
(2)选择检验统计量:
,当显著性水平
,拒绝域为:
即,这台设备经过维修后生产的钢板的厚度没有发生明显的变化。
25.一家保健品厂最近研制出一种新的减肥药品。
为了检验这种减肥药的效果,它分别对10名志愿者服用减肥药之前的体重和服用减肥药一个疗程后的体重进行测量。
测量数据如下:
(单位:
kg)
服药前
71
75
82
69
82.5
76
86
78
80.5
服药后
66
75.5
80
67
79
77
在
的显著性水平下判断这种减肥药是否有效。
这是匹配样本情况下两个总体均值差的检验