第三讲 统计统计案例Word格式文档下载.docx
《第三讲 统计统计案例Word格式文档下载.docx》由会员分享,可在线阅读,更多相关《第三讲 统计统计案例Word格式文档下载.docx(11页珍藏版)》请在冰豆网上搜索。
y1
y2
总计
x1
a
b
a+b
x2
c
d
c+d
a+c
b+d
a+b+c+d
则K2(
)=
,
若K2(
)>
3.841,则有95%的把握说两个事件有关;
6.635,则有99%的把握说两个事件有关.
判断下面结论是否正确(请在括号中打“√”或“×
”).
(1)相关关系与函数关系都是一种确定性的关系,也是一种因果关系.(×
)
(2)“名师出高徒”可以解释为教师的教学水平与学生的水平成正相关关系.(√)
(3)只有两个变量有相关关系,所得到的回归模型才有预测价值.(√)
(4)某同学研究卖出的热饮杯数y与气温x(℃)之间的关系,得回归方程
=-2.352x+147.767,则气温为2℃时,一定可卖出143杯热饮(×
(5)事件X,Y关系越密切,则由观测数据计算得到的K2的观测值越大.(√)
(6)由独立性检验可知,有99%的把握认为物理成绩优秀与数学成绩有关,某人数学成绩优秀,则他有99%的可能物理优秀.(×
1.(2015·
北京卷)某校老年、中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为(C)
类别
人数
老年教师
900
中年教师
1800
青年教师
1600
合计
4300
A.90B.100C.180D.300
解析:
设该样本中的老年教师人数为x,由题意及分层抽样的特点得
=
,故x=180.
2.(2014·
山东卷)为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:
kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率分布直方图,已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为(C)
A.6B.8
C.12D.18
由图知,样本总数为N=
=50.设第三组中有疗效的人数为x,则
=0.36,x=12.故选C.
3.下列关于K2的说法中正确的是(C)
A.K2在任何相互独立问题中都可以用来检验有关还是无关
B.K2的值越大,两个事件的相关性就越大
C.K2是用来判断两个分类变量是否有关系的随机变量,只对于两个分类变量适合
D.K2的观察值k的计算公式为:
k=
4.(2015·
北京卷)高三年级267位学生参加期末考试,某班37位学生的语文成绩、数学成绩与总成绩在全年级中的排名情况如图所示,甲、乙、丙为该班三位学生.
从这次考试成绩看,
①在甲、乙两人中,其语文成绩名次比其总成绩名次靠前的学生是乙;
②在语文和数学两个科目中,丙同学的成绩名次更靠前的科目是数学.
一、选择题
1.下列说法:
①一组数据不可能有两个众数;
②一组数据的方差必须是正数;
③一组数据中的每个数据都加上或减去同一常数后,方差恒不变;
④在频率分布直方图中,每个小长方形的面积等于相应小组的频率.其中错误的个数是(C)
A.0个 B.1个C.2个D.3个
①②错误,一组数据中可以有多个众数,故①错误;
一组数据的方差可以为零,故②错误.
2.(2015·
陕西卷)某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为(C)
A.93B.123C.137D.167
初中部的女教师人数为110×
70%=77,高中部的女教师人数为150×
(1-60%)=60,该校女教师的人数为77+60=137,故选C.
3.在研究某种新药对鸡瘟的防治效果问题时,得到了以下数据:
活鸡数
死亡数
新药
132
18
150
对照
115
35
247
53
300
下列结论中正确的一项是(A)
A.有95%的把握认为新药对防治鸡瘟有效
B.有99%的把握认为新药对防治鸡瘟有效
C.有99.9%的把握认为新药对防治鸡瘟有效
D.没有充分证据显示新药对防治鸡瘟有效
K2(
≈6.623.
因为6.623>3.841,所以有95%的把握认为新药防治鸡瘟有效.
山东卷)已知某批零件的长度误差(单位:
毫米)服从正态分布N(0,32),从中随机取一件,其长度误差落在区间(3,6)内的概率为(B)
(附:
若随机变量ξ服从正态分布N(μ,σ2),则P(μ-σ<ξ<μ+σ)=68.26%,P(μ-2σ<ξ<μ+2σ)=95.44%.)
A.4.56%B.13.59%C.27.18%D.31.74%
由正态分布的概率公式知P(-3<ξ<3)=0.6826,P(-6<ξ<6)=0.9544,故P(3<ξ<6)=
=0.1359=13.59%,故选B.
5.(2015·
湖南卷改编)在一次马拉松比赛中,35名运动员的成绩(单位:
分钟)的茎叶图如图所示.
若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是(D)
A.1B.2C.3D.4
35÷
7=5,因此可将编号为1~35的35个数据分成7组,每组有5个数据,在区间[139,151]上共有20个数据,分在4个小组中,每组取一人,共取4人.
6.在样本的频率分布直方图中,一共有m(m≥3)个小矩形,第3个小矩形的面积等于其余m-1个小矩形面积之和的
,且样本容量为100,则第3组的频数是(C)
A.0.2B.25
C.20D.以上都不正确
第3组的频率是
,样本容量为100,
∴第3组的频数为100×
=20.
二、填空题
7.某校甲、乙两个班级各有5名编号为1,2,3,4,5的学生进行投篮练习,每人投10次,投中的次数见下表:
学生
1号
2号
3号
4号
5号
甲班
6
7
8
乙班
9
则以上两组数据的方差中较小的一个为s2=
.
考查统计中的平均值与方差的运算.
甲班的方差较小,数据的平均值为7,
故方差s2=
.
8.下列是某厂1~4月份用水量(单位:
百吨)的一组数据:
月份x
1
2
3
4
用水量y
4.5
2.5
由其散点图知,用水量y与月份x之间有较好的线性相关关系,其线性回归方程是
=-0.7x+a,则a=5.25.
x=2.5,y=3.5,
∴a=y-b
=3.5-(-0.7)×
2.5=5.25.
三、解答题
9.某班主任对全班50名学生学习积极性和对待班级工作的态度进行了调查,统计数据如下表所示:
(1)如果随机抽查这个班的一名学生,那么抽到积极参加班级工作的学生的概率是多少?
抽到不太主动参加班级工作且学习积极性一般的学生的概率是多少?
(2)试运用独立性检验的思想方法分析:
学生的学习积极性与对待班级工作的态度是否有关系?
并说明理由.
(参考下表)
P[K2(
)≥k]
0.50
0.40
0.25
0.15
0.10
0.05
0.025
0.010
0.005
0.001
k
0.455
0.708
1.323
2.072
2.706
3.841
5.024
6.635
7.879
10.828
(1)积极参加班级工作的学生有24人,总人数为50人,概率为
;
不太主动参加班级工作且学习积极性一般的学生有19人,概率为
(2)K2(
≈11.5,∵K2(
)>6.635,∴有99%的把握认为学习积极性与对待班级工作的态度有关系.
10.某良种培育基地正在培育一种小麦新品种A,将其与原有的一个优良品种B进行对照试验,两种小麦各种植了25亩,所得亩产数据(单位:
千克)如下:
.
品种A:
357,359,367,368,375,388,392,399,400,405,412,414,415,421,423,423,427,430,430,434,443,445,445,451,454.
品种B:
363,371,374,383,385,386,391,392,394,394,395,397,397,400,401,401,403,406,407,410,412,415,416,422,430.
(1)画出茎叶图.
(2)用茎叶图处理现有的数据,有什么优点?
(3)观察茎叶图,对品种A与B的亩产量及其稳定性进行比较,写出统计结论.
(1)茎叶图如下图所示:
(2)用茎叶图处理现有的数据不仅可以看出数据的分布状况,而且可以看出每组中的具体数据.
(3)通过观察茎叶图,可以发现品种A的平均每亩产量为411.1千克,品种B的平均亩产量为397.8千克.由此可知,品种A的平均亩产量比品种B的平均亩产量高.但品种A的亩产量不够稳定,而品种B的亩产量比较集中在平均产量附近.