二轮复习统计与统计案例docx.docx
《二轮复习统计与统计案例docx.docx》由会员分享,可在线阅读,更多相关《二轮复习统计与统计案例docx.docx(12页珍藏版)》请在冰豆网上搜索。
二轮复习统计与统计案例docx
二轮复习一统计与统计案例
适用学科
高中数学
适用年级
高中三年级
适用区域
通用
课时时长(分钟)
60
知识点
抽样方法;统计图表;样本的数字特征;变量间的相关关系;冋归分析;独立检验
教学目标
掌握抽样方法,统计图表的特征,能对样本的数字特征进行分析,学会独立性检验的基本思路、方法及相关计算与推断
教学重点
抽样方法,样本的数字特征和冋归分析,独立性检验的基本思路、方法及相关计算与推断
教学难点
与统计知识交汇问题
教学过程
一、课堂导入
高考考情分析
1.以客观题形式考查抽样方法,样本的数字特征和回归分析,独立性检验的基本思路、方法及相关计算与推断.
2.本部分较少命制大题,若在大题屮考查多在概率与统计、算法框图等知识交汇处命题,重点考查抽样方法,频率分布直方图和冋归分析或独立性检验,注意加强抽样后绘制频率分布直方图,然后作统计分析或求概率的综合练习.
2.复习预习
复习整合知识点:
抽样方法;统计图表;样本的数字特征;变量间的相关关系;回归分析;独立检验
三、知识讲解
考点1
1・抽样方法
类别
共同点
各自特点
相互联系
适用范围
简单随机抽样
抽样过程中每个个体被抽取的概率相等
从总体中逐个抽取
总体中的个体数较少
系统抽样
将总体均分成几部分,按事先确定的规则在各部分抽取
在起始部分抽样时采用简单随机抽样
总体中的个体数较多
分层抽样
将总体分成几层,分层进行抽取
分层抽样时采用简单随机抽样或系统抽样
总体由差异明显的几部分组成
(1)在频率分布直方图中:
①各小矩形的面积表示相应各组的频率,
各小矩形的高=
频率
②各小矩形面积之
和等于1;③屮位数左右两侧的直方图面积相等,因此可以估计其近似值.
(2)茎叶图
当数据有两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长岀来的叶子,因此通常把这样的图叫做茎叶图.
当数据有三位有效数字,前两位相对比较集中时,常以前两位为茎,第三位(个位)为叶(其余类推).
⑴众数
在样本数据中,频率分布最大值所对应的样本数据(或岀现次数最多的那个数据).
(2)中位数
样本数据中,将数据按大小排列,位于最中间的数据.如果数据的个数为偶数,就取当中两个数据的平均数作为中位数.
(3)平均数与方差
样本数据的平均数T=^(Xi+x2+...+xn).
方差S2=^[(X|—X)2+(x2—X)2+...+(xn—X)2].
注意:
(1)现实中总体所包含的个体数往往较多,总体的平均数与标准差、方差是不知道(或不可求)的,所以我们通常用样本的平均数与标准差、方差来估计总体的平均数与标准差、方差.
(2)平均数反映了数据取值的平均水平,标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大,越不稳定.
(1)利用散点图可以初步判断两个变量之间是否线性相关.如果散点图中的点从整体上看大致分布在一条直线的附近,我们说变量x和y具有线性相关关系.
(2)用最小二乘法求回归盲线的方程
设线性回归方程为J=bx+a,则
厂
n__n
X(Xi—X)(yj-y)XxiYi-nxy
Ai=li=l
b==
VZ(X|—7)2工
i=li=I
A——A——
la=y—bx
注意:
回归直线一定经过样本的中心点(殳,7),据此性质可以解决有关的计算问题.
Z(Xi—x)(yi—y)
r=,叫做相关系数.
A/Z(Xj-7)2t(Yi-?
)2
iTiT
相关系数用来衡量变量x与y之间的线性相关程度;|r|Sl,且|r|越接近于1,相关程度越高,|r|越接近于0,相关程度越低.
假设有两个分类变量X和Y,它们的取值分别为{xi,X2}和{yi,y?
},其样本频数列联表(称为2X2列联表)为
yi
Y2
总计
X1
a
b
a+b
X2
c
d
c+d
总计
a+c
b+d
a+b+c+d
(a+b+c+d)(ad_bc)2
人」一(a+b)(c+d)(a+c)(b+d),
若K2>3.841,则有95%的把握说两个事件有关;若K2>6.635,则有99%的把握说两个事件有关;若K2<2.706,则没有充分理由认为两个事件有关.
考点一抽样方法
例1
某高校共有450名学生参加环保知识测试,其中男生250名,女生200名,己知所有学生的成绩均大于60且小于等于100,现按性别用分层抽样的方法从中抽取45名学生的成绩,从男生和女生中抽查的结果分别如表1和表2:
表1
成绩分组
(60,70]
(70,80]
(80,90]
(90,100]
人数
3
m
8
6
表2
成绩分组
(60,70]
(70,80]
(80,90]
(90,100]
人数
2
5
n
4
(1)求m,n的值,
(2)记表2中分组在(60,70]中的2名女生为A、B,(90,100]中的4名女生为C、D、E、F,现从表2中(60,70]的女牛中抽取1人,从(90,100]的女生中抽取2人做专题发言,求(60,70]中的女生A和(90,100]中的女生C同时被抽到的概率是多少?
【规范解答】
所以m=25-(3+8+6)=8,n=20-(2+5+4)=9,故m=8,n=9.
(2)满足题意的所有抽法共有12种,情况如下:
(A,C,D),(A,C,E),(A,C,F),(A,D,E),(A,D,F),(A,E,F),(B,C,D),(B,C,E),(B,C,F),(B,D,
E),(B,D,F),(B,E,F).
其中A和C同时被抽中的情况有3种如下所示:
(A,C,D),(A,C,E),(A,C,F).
31
所以A和C同时被抽中的概率为P=j^=-
【总结与反思】
1.观察茎叶图重点看数据的集中程度.
2.求中位数、平均数、方差主要依据公式进行计算.
3.在频率分布直方图中,平均数的估计值等于每个小矩形的面积乘以小矩形底边中点横坐标之和;在中位数的估计值两侧直方图的面积相等;最高小矩形中点对应数据为这组数据的众数.
4.方差越大,数据的波动程度越大,越不稳定.
5.准确理解给出图表及已知条件中数据的含义是解决统计问题的关键.
例2班主任为了对本班学生的考试成绩进行分析,决定从全班25位女同学,24位男同学中随机抽取一个容量为8的样本进行分析.若这8位同学的数学、物理分数对应如下表:
学生编号
1
2
3
4
5
6
7
8
数学分数X
60
65
70
75
80
85
90
95
物理分数y
72
77
80
84
88
90
93
95
上表数据表示变量y与x的相关关系.
(1)画岀样本的散点图,并说明物理分数y与数学分数x之间是正相关还是负相关;
(2)求y与x的线性回归直线方程(系数精确到0.01),并指出某学生数学83分,物理约为多少分(精确到1分)?
参考公式:
回归直线的方程是:
y=bx+a,
n__
A—A—a=y—bx•
S(Xi—x)(yi-y)i=l
其中b=
S(Xi—£)2
i=l
__8_8__
参考数据:
X=77.5,y"85,E(Xi-x)2=1050,Y(冶一x)(%—y)~688.
i=li=l
由图可知:
物理分数y与数学分数x之间是正相关关系.
(2)从散点图中可以看出,这些点分布在一条直线附近,因此以用公式计算得,
8__
Z(Xi—x)(yi-y)
ai=1688__J_
b==]050宀0・66,由x—77・5,y心85,得ei=y—bx—85—0.66X77・5~33・85.
Z(Xi—X)2
i=l
所以回归直线方程为y=0・66x+33.85.当x=83时,y=0.66X83+33.85=88.63~89・因此某学生数学83分时,物理约为89分.
【总结与反思】
AA—A—
求线性回归方程关键是熟练运用b的计算公式和y-bx.
考点三独立性检验及其应用
例3某校举办安全法规知识竞赛,从参赛的高一、高二学生中各抽出100人的成绩作为样本.对高一年级的100
名学生的成绩进行统计,并按[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]分组,得到成绩分布的频率分布直方
(1)若规定60分以上(包括60分)为合格,计算高一年级这次知识竞赛的合格率;
(2)统计方法屮,同一组数据常用该组区间的中点值作为代表,据此,估计高一年级参加这次知识竞赛的学生的平均成绩;
(3)若高二年级这次知识竞赛的合格率为60%,由以上统计数据填写下面2X2列联表,并问是否有99%的把握认为
“这次知识竞赛的成绩与年级有关系”・
高一
高二
总计
合格人数
不合格人数
合计
附:
P(K2>k)
0.025
0.010
0.005
k
5.024
6.635
7.879
2
n(ad—be)
(a+b)(c+d)(a+c)(b+d)
【规范解答】
(1)高一年级的合格率为0.02X10+0.03X10+0.02X10+0.01X10=0.8=80%.
⑵高一年级样木的平均数为45X卷+55X需+65X探+75X探+85X探+95X需=72,
据此,可以估计高一年级这次知识竞赛的学生的平均成绩为72分.
⑶
高一
高二
总计
合格人数
80
60
140
不合格人数
20
40
60
合计
100
100
200
0200(80X40-20X60)2
K==95>6635,
100X100X140X60v0,0J
所以有99%的把握认为“这次知识竞赛的成绩与年级有关系”.
【总结与反思】
理解独立性检验的思想方法,会用”公式计算,并与给击的数据比较作击判断,是解决这类问题的关键.
例4某市共有100万居民的月收入是通过“工资薪金所得”得到的,如图是抽样调查后得到的工资薪金所得x的频率分布直方图.工资薪金个人所得税税率表如表所示.表中“全月应纳税所得额”是指“工资薪金所得”减去3500元所超出的部分(3500元为个税起征点,不到3500元不交税)
工资个税的计算公式为:
“应纳税额”=“全月应纳税所得额”乘以“适用税率”减去“速算扣除数”.
某人某月“工资薪金所得”为5500元,则“全月应纳税所得额”为5500-3500=2000元,应纳税额为2000x10%-105=95(元)・
在直方图的工资薪金所得分组中,以各组的区间中点值代表该组的各个值,工资薪金所得落入该区间的频率x作为取该区间中点值的概率.
全月应纳税所得额
适用税率(%)
速算扣除数
不超过1500元
3
0
超过1500元卒4500元
10
105
超过4500元至9000元
20
555
(1)试估计该市居民毎月在工资薪金个人所得税上缴纳的总税款;
(2)设该市居民每月从工资薪金交完税后,剩余的为其月可支配额%元),试求该市居民月可支配额y的数学期望.
【规范解答】
(1)工资薪金所得的5组区间的中点值依次为3000、5000、7000、9000、11000,x取这些值的概率依次为0.15、0.3、0.4、0.1、0.05,算得与其相对应的”全月应纳税所得额”依次为0,1500,3500,5500,7500(元),按工资个税的计算公式,相应的工雲个税分别为:
0(元),
1500X3%—0=45(元),
3500X10%-105=245(元),
5500X20%-555=545(元),
7500X20%—555=945(元);
・・・该市居民每月在工资薪金个人所得税上缴的总税款为(45X0.3+245X0.4+545X0.1+945X0.05)X106=2.1325X10"元;
(2)这5组居民月可支配额y取的值分别是y”y2,y3,y4,y5,
yi=3000(元);
『2=5000—45=4955(元);
y3=7000-245=6755(元);
*=9000—545=8455(元);
y5=11000-945=10055(元);
Ay的分布列为:
y
3000
4955
6755
8455
10055
P
0.15
0.3
0.4
0.1
0.05
・••该市居民月可支配额的数学期望为:
E(y)=3000X0.15+4955X0.3+6755X0.4+8455X0.1+10055X0.05=5986.75(元)
课程小结
1•当总体数N不能被样本容量整除,用系统抽样法剔除多余个体时,必须随机抽样.
2.注意中位数与平均数的区别,中位数可能不在样本数据中.