高三数学南方凤凰台高届高级高三一轮数学提高版完整版学案第九章.docx
《高三数学南方凤凰台高届高级高三一轮数学提高版完整版学案第九章.docx》由会员分享,可在线阅读,更多相关《高三数学南方凤凰台高届高级高三一轮数学提高版完整版学案第九章.docx(26页珍藏版)》请在冰豆网上搜索。
高三数学南方凤凰台高届高级高三一轮数学提高版完整版学案第九章
第九章 统计
第50讲 抽样的方法、用样本估计总体
A 应知应会
一、选择题
1.下列抽取样本的方式属于简单随机抽样的个数为( )
①从无限多个个体中抽取100个个体作为样本;
②盒子里共有80个零件,从中选出5个零件进行质量检验,在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里;
③从20件玩具中一次性抽取3件进行质量检验;
④某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛.
A.0 B.1 C.2 D.3
2.(2019·运城一模)在某中学举行的环保知识竞赛中,将三个年级参赛学生的成绩进行整理后分为5组,绘制如图所示的频率分布直方图,图中从左到右依次为第一、第二、第三、第四、第五小组,已知第二小组的频数是40,则成绩在80~100分的学生人数是( )
(第2题)
A.15 B.18C.20D.25
3.(多选)如图是2018年第一季度五省GDP的情况图,则下列描述中正确的是( )
(第3题)
A.与去年同期相比2018年第一季度五个省的GDP总量均实现了增长
B.2018年第一季度GDP增速由高到低排位第5的是浙江省
C.2018年第一季度GDP总量和增速由高到低排位均居同一位的省只有1个
D.去年同期河南省的GDP总量不超过4000亿元
4.(多选)(2019·烟台一模)如图
(1)为某省2019年1~4月快递业务量统计图,图2是该省2019年1~4月快递业务收入统计图,下列对统计图理解正确的是( )
图
(1)
图
(2)
(第4题)
A.2019年1~4月的业务量,3月最高,2月最低,差值接近2000万件
B.2019年1~4月的业务量同比增长率均超过50%,在3月底最高
C.从两图来看,2019年1~4月中的同一个月的快递业务量与收入的同比增长率并不完全一致
D.从1~4月来看,该省在2019年快递业务收入同比增长率逐月增长
二、解答题
5.(2019·张家口期末)某医疗器械公司在全国共有100个销售点,总公司每年会根据每个销售点的年销量进行评价分析.规定每个销售点的年销售任务为一万四千台器械.根据这100个销售点的年销量绘制出如图所示的频率分布直方图.
(1)试问:
完成年销售任务的销售点有多少个?
(2)若用分层抽样的方法从这100个销售点中抽取容量为25的样本,求该五组[2,6),[6,10),[10,14),[14,18),[18,22](单位:
千台)中每组分别应抽取的销售点数量.
(第5题)
6.(2019·安师附中)从某校高三年级800名男生中随机抽取50名学生测量其身高,据测量,被测学生的身高全部在155cm到195cm之间.将测量结果按如下方式分成8组:
第一组[155,160),第二组[160,165),…,第八组[190,195],如图是按上述分组得到的频率分布直方图的一部分.已知第一组与第八组的人数相同,第七组与第六组的人数差恰好为第八组与第七组的人数差.
(第6题)
求下列频率分布表中所标字母的值,并补充完成频率分布直方图.
频率分布表:
分组
频数
频率
频率/组距
…
…
…
…
[180,185)
x
y
z
[185,190)
m
n
p
…
…
…
…
B组 能力提升
一、填空题
1.为调查德克士各分店的经营状况,某统计机构用分层抽样的方法,从A,B,C三个城市中抽取若干家德克士分店组成样本进行深入研究,有关数据见下表:
(单位:
个)
城市
德克士
抽取数量
A
26
2
B
13
x
C
39
y
则样本容量为________.
2.从某企业的某种产品中抽取1000件,测量该种产品的一项质量指标值,由测量结果得到如图所示的频率分布直方图,假设这项指标在[185,215]内,则这项指标合格,估计该企业这种产品在这项指标上的合格率为________.
(第2题)
3.(2019·台州调研)已知一组数据x1,x2,x3,x4,x5的方差是2,则数据2x1,2x2,2x3,2x4,2x5的标准差为________.
4.某工厂对一批新产品的长度(单位:
mm)进行检测,如图是检测结果的频率分布直方图,据此估计这批产品的中位数为________.
(第4题)
二、解答题
5.甲、乙两人参加某体育项目训练,近期的五次测试成绩(单位:
分)如图所示.
(1)分别求出甲、乙两人成绩的平均数与方差;
(2)根据
(1)的结果,对两人的成绩作出评价.
(第5题)
6.(2019·焦作期中节选)炎炎夏季,水蜜桃成为备受大家欢迎的一种水果,某果园的水蜜桃质量分布如图所示.
(1)求m的值;
(2)经市场调查,该种水蜜桃在过去50天的销售量(单位:
kg)和价格(单位:
元/kg)均为销售时间t(单位:
天)的函数,且销售量近似地满足f(t)=-3t+300(1≤t≤50,t∈N),前30天价格为g(t)=
t+20(1≤t≤30,t∈N),后20天价格为g(t)=30(31≤t≤50,t∈N),求日销售额S的最大值.
(第6题)
第51讲 数据分析——成对数据的统计分析
课时1 一元线性回归模型及其应用
A 应知应会
一、选择题
1.线性回归方程表示的直线y=a+bx必经过点( )
A.(0,0) B.(
0)
C.(
) D.(0,
)
2.下列两个变量之间的关系是相关关系的是( )
A.速度一定时,位移与时间
B.单位面积的产量为常数时,土地面积与总产量
C.身高与体重
D.电压一定时,电流与电阻
3.(2019·合肥调研)设(x1,y1),(x2,y2),…,(xn,yn)是变量x和y的n个样本点,直线l是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论正确的是( )
(第3题)
A.直线l过点(
)
B.x和y的相关系数为直线l的斜率
C.x和y的相关系数在0到1之间
D.当n为偶数时,分布在l两侧的样本点的个数一定相同
4.在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=
x+1上,则这组样本数据的样本相关系数为( )
A.-1 B.0 C.
D.1
5.对具有线性相关关系的变量x,y,测得一组数据如下:
x
2
4
5
6
8
y
20
40
60
70
80
根据上表,利用最小二乘法得它们的回归直线方程为
=10.5x+
据此模型来预测当x=20时,y的估计值为( )
A.210 B.210.5 C.211.5 D.212.5
二、解答题
6.(2019·泰安模拟)以下是某地搜集到的新房屋的销售价格y和房屋面积x的数据:
房屋面积x(m2)
115
110
80
135
105
销售价格y(万元)
24.8
21.6
18.4
29.2
22
(1)画出数据对应的散点图;
(2)求回归方程,并在散点图中加上回归直线;
(3)据
(2)的结果,估计当房屋面积为150m2时的销售价格.(结果保留四位小数)
7.(2019·上饶二模)在2018年俄罗斯世界杯期间,莫斯科的部分餐厅经营了来自中国的小龙虾,这些小龙虾标有等级代码.为得到小龙虾等级代码数值x与销售单价y之间的关系,经统计得到如下数据:
等级代码数值x
38
48
58
68
78
88
销售单价y(元/kg)
16.8
18.8
20.8
22.8
24
25.8
(1)已知代码超过60的为A等品,某公司从上表6种产品中任取2种产品进口,求2种产品全为A等品的概率;
(2)已知销售单价y与等级代码数值x之间存在线性相关关系,求y关于x的线性回归方程(系数精确到0.1);
(3)若莫斯科某餐厅销售的中国小龙虾的等级代码数值为98,请估计该等级的中国小龙虾销售单价为多少元.
参考公式:
回归直线的斜率和截距的最小二乘估计公式分
B组 能力提升
一、填空题
1.已知变量x,y具有线性相关关系,它们之间的一组数据如下表所示:
x
1
2
3
4
y
0.1
1.8
m
4
若y关于x的回归方程为
=1.3x-1,则m=________.
2.(2019·安庆二模)已知由样本数据点集合{(xi,yi)|i=1,2,…,n}求得的回归直线方程为
=1.5x+0.5,且
=3.现发现两个数据点(1.1,2.1)和(4.9,7.9)误差较大,去除后重新求得的回归直线l的斜率为1.2,那么,当x=2时,y的估计值为________.
3.某男数学老师身高176cm,他爷爷、父亲和儿子的身高分别是173cm、170cm和182cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为________cm.
4.(2019·厦门二模)某种细胞的存活率y(%)与存放温度x(℃)之间具有线性相关关系,其样本数据如下表所示:
存放温度x(℃)
20
15
10
5
0
-5
-10
存活率y(%)
6
14
26
33
43
60
63
计算得
=5,
=35,
并求得回归直线为
=-2x+45.但实验人员发现表中数据x=-5的对应值y=60录入有误,更正为y=53,则更正后的回归直线方程为________.
二、解答题
5.(2019·烟台二模)混凝土具有原材料丰富、抗压强度高、耐久性好等特点,是目前使用量最大的土木建筑材料.抗压强度是混凝土质量控制的重要技术参数,也是实际工程对混凝土要求的基本指标.为了解某型号某批次混凝土的抗压强度(单位:
MPa)随龄期(单位:
天)的发展规律,质检部门在标准试验条件下记录了10组混凝土试件在龄期xi(i=1,2,…,10)分别为2,3,4,5,7,8,12,14,17,21时的抗压强度yi的值,并对数据作了初步处理,得到下面的散点图及一些统计量的值.
(第5题)
(1)根据散点图判断y=a+bx与y=c+dlnx哪一个适宜作为抗压强度y关于龄期x的回归方程类型,选择其中的一个模型,并根据表中数据,建立y关于x的回归方程;
(2)工程中常把龄期为28天的混凝土试件的抗压强度f28视作混凝土抗压强度标准值.已知该型号混凝土设置的最低抗压强度标准值为40MPa.
①试预测该批次混凝土是否达标;
②由于抗压强度标准值需要较长时间才能评定,早期预测在工程质量控制中具有重要的意义,经验表明,该型号混凝土第7天的抗压强度f7与第28天的抗压强度f28具有线性相关关系f28=1.2f7+7,试估计在早期质量控制中,龄期为7天的试件需达到的抗压强度.
参考数据:
ln2≈0.69,ln7≈1.95.
6.(2019·武汉三模)菜市房管局为了了解该市市民2018年1月至2019年1月期间购买二手房情况,首先随机抽样其中200名购房者,并对其购房面积m(单位:
m2,60≤m≤130)进行了一次调查统计,制成了如图
(1)所示的频率分布直方图,接着调查了该市2018年1月~2019年1月期间当月在售二手房均价y(单位:
万元/平方米),制成了如图
(2)所示的散点图(图中月份代码1~13分别对应2018年1月至2019年1月).
图
(1)
图
(2)
(第6题)
(1)试估计该市市民的平均购房面积
.
(2)现采用分层抽样的方法从购房面积位于[110,130]的40位市民中随机取4人,再从这4人中随机抽取2人,求这2人的购房面积恰好有一人在[120,130]的概率;
(3)根据散点图选择
=
+
和
=
+
lnx两个模型进行拟合,经过数据处理得到两个回归方程,分别为
=0.9369+0.0285
和
=0.9554+0.0306lnx并得到一些统计量的值,如下表所示:
请利用相关指数R2判断哪个模型的拟合效果更好,并用拟合效果更好的模型预测2019年6月份的二手房购房均价(精确到0.001).
参考数据:
ln2≈0.69,ln3≈1.10,ln17≈2.83,ln19≈2.94,
≈1.41,
≈1.73,
≈4.12,
≈4.36;
参考公式:
课时2 分类变量与列联表
A 应知应会
一、选择题
1.观察下列各图,其中两个分类变量x,y之间关系最强的是( )
2.经过对K2的统计量的研究,得到了若干个临界值,当K2≤2.706时,我们认为事件A与B( )
A.有95%的把握认为A与B有关系
B.有99%的把握认为A与B有关系
C.没有充分理由说明事件A与B有关系
D.不能确定
3.为了了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机抽取了60名高中生,通过问卷调查,得到以下数据:
作文成绩优秀
作文成绩一般
总计
课外阅读量较大
22
10
32
课外阅读量一般
8
20
28
总计
30
30
60
由以上数据,计算得到K2的观测值k≈9.643,根据临界值表,以下说法正确的是( )
A.没有充足的理由认为课外阅读量大与作文成绩优秀有关
B.有0.5%的把握认为课外阅读量大与作文成绩优秀有关
C.在犯错误的概率不超过0.001的前提下认为课外阅读量大与作文成绩优秀有关
D.在犯错误的概率不超过0.005的前提下认为课外阅读量大与作文成绩优秀有关
4.某市政府调查市民收入与旅游欲望时,采用独立性检验法抽取2019人,计算发现K2的观测值k≈6.723,则根据这一数据,市政府断言“市民收入与旅游欲望有关系”犯错误的概率不超过( )
A.0.005 B.0.05 C.0.025 D.0.01
5.某班主任对全班50名学生进行了作业量的评价调查,所得数据如下表所示:
认为作业量大
认为作业量不大
总计
男生
18
9
27
女生
8
15
23
总计
26
24
50
则认为作业量的大小与学生的性别有关的犯错误的概率不超过( )
A.0.01 B.0.025
C.0.10 D.无充分证据
二、解答题
6.(2019·芜湖二模)随着科技的发展,近年看电子书的国人越来越多,所以近期有许多人呼吁“回归纸质书”.目前出版物阅读中纸质书占比出现上升,现随机选出200人进行采访,经统计这200人中看纸质书的人数占总人数的
将这200人按年龄分成五组:
第1组[15,25),第2组[25,35),第3组[35,45),第4组[45,55),第5组[55,65],其中统计看纸质书的人数得到的频率分布直方图如图所示.
(1)求a的值及看纸质书的人的平均年龄;
(2)按年龄划分,把年龄在[15,45)的称青壮年组,年龄在[45,65]的称为中老年组,若选出的200人中看电子书的中老年人有10人,请完成下面2×2列联表,并判断能否在犯错误的概率不超过0.1的前提下认为看书方式与年龄层有关.
(第6题)
看电子书
看纸质书
合计
青壮年
中老年
合计
附:
K2=
(其中n=a+b+c+d).
P(K2≥k0)
0.10
0.05
0.025
0.010
0.005
0.001
k0
2.706
3.841
5.024
6.635
7.879
10.828
7.(2019·泸州调研)某校数学课外兴趣小组为研究数学成绩是否与性别有关,先统计本校高三年级每个学生一学期数学成绩的平均分(采用百分制),剔除平均分在30分以下的学生后,共有男生300名,女生200名.现采用分层抽样的方法,从中抽取了100名学生,按性别分为两组,并将两组学生成绩分为6组,得到如下表所示的频数分布表:
分数段
[40,50)
[50,60)
[60,70)
[70,80)
[80,90)
[90,100]
男
3
9
18
15
6
9
女
6
4
5
10
13
2
(1)估计男、女生各自的平均分(同一组数据用该组区间中点值作代表),从计算结果看,数学成绩与性别是否有关?
(2)规定80分以上为优秀(含80分),请你根据已知条件作出2×2列联表,并判断是否在犯错误的概率不超过0.1的前提下认为数学成绩与性别有关.
优秀
非优秀
总计
男生
女生
总计
100
B组 能力提升
一、填空题
1.独立性检验所采用的思路是:
要研究X,Y两个分类变量彼此相关,首先假设这两个分类变量彼此________,在此假设下构造随机变量K2.如果K2的观测值较大,那么在一定程度上说明假设________.
2.天宫二号成功发射,由此许多人认为中国进入了航天强国之列,也有许多人持反对意见,为此进行了调查.在参加调查的3648名男性公民与3432名女性公民中,持反对意见的男性有1843人,女性有1462人,在运用这些数据说明“天宫二号”成功发射是否与中国进入航天强国有关系时,用________最具说服力.(填序号)
①回归直线方程;②平均数与方差;③独立性检验.
3.某部门通过随机调查89名工作人员的休闲方式,了解读书和健身的人数,得到的数据如下表:
分类
读书
健身
总计
女
24
31
55
男
8
26
34
总计
32
57
89
在犯错误的概率不超过________的前提下认为性别与休闲方式有关系.
4.为研究某新药的疗效,给100名患者服用此药,跟踪调查后得下表中的数据:
无效
有效
总计
男性患者
15
35
50
女性患者
6
44
50
总计
21
79
100
设H0:
服用此药的效果与患者的性别无关,则K2的观测值k≈________,从而得出结论:
服用此药的效果与患者的性别有关,这种判断出错的可能性为________.
二、解答题
5.(2019·衡阳二模)教育局为贯彻两会精神,开展了送教下乡活动.为了了解该活动的受欢迎程度,对某校初一年级按分层抽样的方法抽取一部分进行调研,已知该年级学生共有1200人,其中女生共有540人,被抽到调研的男生共有55人.
(1)该校被抽到调研的女生共有多少人?
(2)若每个参与调研的学生都必须在“欢迎”与“不太欢迎”中选一项,调研的情况统计如下表:
欢迎
不太欢迎
合计
男生
45
女生
15
合计
请将表格填写完整,并根据此表数据说明是否有95%的把握认为“欢迎活动与性别有关”;
(3)在该校初一
(二)班被抽到的5名学生中有3名学生欢迎该活动,2名学生不太欢迎该活动,现从这5名学生中随机抽取2人,求恰有1人欢迎该活动的概率.
附:
K2=
.
P(K2≥k0)
0.050
0.010
0.005
0.001
k0
3.841
6.635
7.879
10.828
6.(2019·济南期末)某企业生产了一种新产品,在推广期邀请了100位客户试用该产品,每人一台.试用一个月之后进行回访,由客户先对产品性能作出“满意”或“不满意”的评价,再让客户决定是否购买该试用产品(不购买则可以免费退货,购买则仅需付成本价).经统计,决定退货的客户人数占总人数的一半,“对性能满意”的客户比“对性能不满意”的客户多10人,“对性能不满意”的客户中恰有
选择了退货.
(1)请完成下面的2×2列联表,并判断是否有99%的把握认为“客户购买产品与对产品性能满意之间有关”;
对性能满意
对性能不满意
合计
购买产品
不购买产品
合计
(2)企业为了改进产品性能,现从“对性能不满意”的客户中按是否购买产品进行分层抽样,随机抽取6位客户进行座谈,座谈后安排了抽奖环节,共有4张奖券,奖券上分别印有200元、400元、600元和800元字样,抽到奖券可获得相应奖金.6位客户有放回地进行抽取,每人随机抽取一张奖券,求6位客户中购买产品的客户人均所得奖金不少于500元的概率.
附:
K2=
其中n=a+b+c+d.
P(K2≥k0)
0.150
0.100
0.050
0.025
0.010
k0
2.072
2.706
3.841
5.024
6.635
微难点11 建立统计模型进行预测
一、解答题
1.某市房产契税标准如下:
购房总价(万元)
(0,200]
(200,400]
(400,+∞)
税率
1%
1.5%
3%
从该市某高档住宅小区随机调查了一百户居民,获得了他们的购房总额数据,整理得到了如图所示的频率分布直方图.
(1)假设该小区已经出售了2000套住房,估计该小区有多少套房子的总价在300万以上,并说明理由;
(2)假设同组中的每个数据用该组区间的右端点值代替,估计该小区购房者缴纳契税的平均值.
(第1题)
2.某测试团队为了研究“饮酒”对“驾车安全”的影响,随机选取100名驾驶员先后在无酒状态、酒后状态下进行“停车距离”测试.测试的方案:
电脑模拟驾驶,以某速度匀速行驶,记录下驾驶员的“停车距离”(驾驶员从看到意外情况到车子完全停下所需要的距离).无酒状态与酒后状态下的试验数据分别列于表1和表2.
表1 无酒状态
停车距
离d(m)
(10,20]
(20,30]
(30,40]
(40,50]
(50,60]
频数
26
m
n
8
2
表2 酒后状态
平均每毫升血液
酒精含量x(mg)
10
30
50
70
90
平均停车
距离y(m)
30
50
60
70
90
已知表1数据的中位数估计值为26,回答以下问题.
(1)求m,n的值,并估计驾驶员无酒状态下停车距离的平均数;
(2)根据最小二乘法,由表2的数据计算y关于x的回归方程
=
x+
;
(3)该测试团队认为:
驾驶员酒后驾车的平均“停车距离”y大于
(1)中无酒状态下的停车距离平均数的3倍,则认定驾驶员是“醉驾”.请根据
(2)中的回归