计数原理与概率统计复习建议.docx
《计数原理与概率统计复习建议.docx》由会员分享,可在线阅读,更多相关《计数原理与概率统计复习建议.docx(27页珍藏版)》请在冰豆网上搜索。
计数原理与概率统计复习建议
《计数原理与概率统计(理)》第一轮复习建议2011.12.2
人大附中吴中才
一、《考试说明》的考试内容与要求层次及变化比较
(一)考试内容与要求层次
考试内容
要求层次
A
B
C
计数
原理
加法原理、
乘法原理
分类加法计数原理、分步乘法计数原理
√
用分类加法计数原理或分步乘法计数原理解决一些简单的实际问题
√
排列与组合
排列、组合的概念
√
排列数公式、组合数公式
√
用排列与组合解决一些简单的实际问题
√
二项式定理
用二项式定理解决与二项展开式有关的简单问题
√
概率
事件与
概率
随机事件的概率
√
随机事件的运算
√
两个互斥事件的概率加法公式
√
古典概型
古典概型
√
几何概型
几何概型
√
概率
取有限值的离散型随机变量及其分布列
√
超几何分布
√
条件概率
√
事件的独立性
√
n次独立重复试验与二项分布
√
取有限值的离散型随机变量的均值、方差
√
正态分布
√
统计
随机抽样
简单随机抽样
√
分层抽样和系统抽样
√
用样本
估计总体
频率分布表,直方图、折线图、茎叶图
√
样本数据的基本的数字特征(如平均数、标准差)
√
用样本的频率分布估计总体分布,用样本的基本数字特征估计总体的基本数字特征
√
变量的相关性
线性回归方程
√
(二)新旧考试说明的比较(新课程与旧大纲的考试说明)
1.旧说明中,“排列、组合、二项式定理”,新说明中,“计数原理”;
2.旧“分类计数原理、分步计数原理”(C),改为“分类加法计数原理、分步乘法计数原理”(B)↓,新说明增加了“用分类加法计数原理或分步乘法计数原理解决一些简单的实际问题”(C);
3.删除了组合数的两个性质(C),增加了“用排列与组合解决一些简单的实际问题”(C);
4.旧“二项式定理”(C)、“二项展开式的性质”(C),改为“用二项式定理解决与二项展开式有关的简单问题”(B);↓
5.旧说明中:
“概率与统计”,新说明中分开说明“统计”与“概率”;
6.旧“互斥事件有一个发生的概率”(B),改为“两个互斥事件的概率加法公式”(C);↑
7.旧“独立事件同时发生的概率”(B),改为“事件的独立性”(A);↓
8.旧“独立重复试验”(B),改为“
次独立重复试验与二项分布”(B);→
9.旧“离散型随机变量及其分布列”(B),改为“取有限值的离散型随机变量及其分布列”(C);↑
10.新说明中增加了“随机事件的运算(B)、几何概型(B)、条件概率(A)、超几何分布(A)”;
11.旧“抽样方法”(B),改为“简单随机抽样(B);分层抽样和系统抽样(A)”;↓
12.旧“总体分布的估计”(B),改为(C);↑
13.新说明中增加了“用样本估计总体”,具体内容见接下来的14~16条;
14.新说明中增加了“频率分布表,直方图、折线图、茎叶图(B)”;
15.新说明中增加了“样本数据的基本的数字特征(如平均数、标准差)(B)”;
16.新说明中增加了“用样本的频率分布估计总体分布,用样本的基本数字特征估计总体的基本数字特征(C)”;↑
17.旧“线性回归”(A),改为“线性回归方程”(B);↑
18.旧中统计的“正态分布”在新说明中归于“概率”.
二、知识内容与结构
(一)知识与教材对应
知识内容涉及教材有:
必修3第二章《统计》、第三章《概率》;选修2-3第一章《计数原理》、第二章《概率》;对选修2-3第三章《统计案例》没作要求.
(二)各板块知识结构
三、近年考试情况分析
(一)近三年高考试题
例1.(09北京理6)若
为有理数),则
()
A.45B.55C.70D.80
【答案】C
(09北京文3)若
为有理数),则
()
A.33B.29C.23D.19
【答案】B
例2.(09北京理7)用0到9这10个数字,可以组成没有重复数字的三位偶数的个数为()
A.324B.328C.360D.648
【答案】B
(09北京文5)用数字1,2,3,4,5组成的无重复数字的四位偶数的个数为()
A.8B.24C.48D.120
【答案】C
例3.(09北京理17)(本小题共13分)
某学生在上学路上要经过4个路口,假设在各路口是否遇到红灯是相互独立的,遇到红灯的概率都是
,遇到红灯时停留的时间都是2min.
(Ⅰ)求这名学生在上学路上到第三个路口时首次遇到红灯的概率;
(Ⅱ)求这名学生在上学路上因遇到红灯停留的总时间
的分布列及期望.
(09北京文Ⅱ)这名学生在上学路上因遇到红灯停留的总时间至多是4min的概率.
【解析】本题主要考查随机事件、互斥事件、相互独立事件等概率知识、考查离散型随机变量的分布列和期望等基础知识,考查运用概率与统计知识解决实际问题的能力.
例4.(10北京理4)8名学生和2位第师站成一排合影,2位老师不相邻的排法种数为()
(A)
(B)
(C)
(D)
【答案】A
例5.(10北京文3)从{1,2,3,4,5}中随机选取一个数为a,从{1,2,3}中随机选取一个数为b,则b>a的概率是()
(A)
(B)
(C)
(D)
【答案】D
例6.
(10北京理11文12)从某小学随机抽取100名同学,将他们的身高(单位:
厘米)数据绘制成频率分布直方图(如图).由图中数据可知a=.若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为.
【答案】a=0.030,3人.
例7.(10北京理17)(本小题共13分)
某同学参加3门课程的考试.假设该同学第一门课程取得优秀成绩的概率为
,第二、第三门课程取得优秀成绩的概率分别为
,
(
>
),且不同课程是否取得优秀成绩相互独立.记ξ为该生取得优秀成绩的课程数,其分布列为
ξ
0
1
2
3
b
(Ⅰ)求该生至少有1门课程取得优秀成绩的概率;
(Ⅱ)求
,
的值;
(Ⅲ)求数学期望
ξ.
【解析】本题考查了概率的性质与概率计算,以及数学期望的计算.
例8.(11北京理12)用数字2,3组成四位数,且数字2,3至少都出现一次,这样的四位数共有__________个.(用数字作答)
【答案】14
例9.(11北京理17)本小题共13分
以下茎叶图记录了甲、乙两组个四名同学的植树棵树.乙组记录中有一个数据模糊,无法确认,在图中以X表示.
(Ⅰ)如果X=8,求乙组同学植树棵树的平均数和方差;
(Ⅱ)如果X=9,分别从甲、乙两组中随机选取一名同学,求这两名同学的植树总棵树Y的分布列和数学期望.
(注:
方差
,其中
为
,
,……
的平均数)
(11北京文Ⅱ)如果X=9,分别从甲、乙两组中随机选取一名同学,求这两名同学的植树总棵数为19的概率.
【解析】本题考查茎叶图,平均数,方差,分布列,期望等知识及概率计算.
(二)考点分布分析
1.计数原理一般考查小题,考查的内容是排列组合计数问题或二项式定理;统计概率部分一般考查一道大题,再辅以0~2题的小题.09年文理各一道大题;10年文两道小题,理科一大一小;11年文理各一道大题.小题以考查统计知识(如抽样方法、频率分布直方图、统计特征量、茎叶图等)和古典概型的概率计算为主,大题仍以互斥事件的概率加法公式、离散型随机变量(取值限于有限个)的分布列与期望为重点,11年将茎叶图与统计特征量和概率的计算结合起来考查,实现了统计与概率的综合.
2.统计案例(独立性检验、回归分析)不列入考试范围,几何概型、条件概率、超几何分布、线性回归、正态分布、随机数的含义与意义(蒙特卡罗方法)较少考查,甚至可能基本不会考查,二项分布也较少考查.统计侧重于统计图表、统计思想(用样本估计总体)和统计特征量的意义的考查,概率侧重于古典概型概率计算及离散型随机变量的概率分布与期望的考查,计数原理侧重于计数原理与二项式定理.
3.新的动向:
把统计和概率结合在一起考查,往往先是对统计图表(频率分布直方图、茎叶图等)的基本考查,然后用样本的频率估计总体的概率,再往离散型随机变量的概率分布方向考查.
四、对新课标的思考
1.关于内容的增删.
本部分新增加要求的内容:
几何概型(B),条件概率(A),超几何分布(A),用样本估计总体(频率分布表,直方图、折线图、茎叶图B;样本数据的基本的数字特征(如平均数、标准差)B;用样本的频率分布估计总体分布,用样本的基本数字特征估计总体的基本数字特征C);删减的内容:
几何分布.
2.统计与概率的意义是什么?
统计是研究如何合理收集、整理、分析数据的学科,它可以为人们制定决策提供依据.概率是研究随机现象规律的学科,它为人们认识客观世界提供了重要的思维模式和解决问题的方法,同时为统计学的发展提供了理论基础.
3.为什么要不讲排列组合而先讲概率?
在以前的大纲版教材中,都是先讲排列组合再讲概率,而新课程则在必修3中直接讲概率,排列组合知识则安排在选修2-3第一章,并在第二章安排离散型随机变量的概率分布.新课程这样安排的主要目的就是防止繁杂的排列组合计数问题干扰了学生对概率的认识,避免以概率计算代替概率意义的理解,因而教材中选择了一些简单例子(一般列举出来的所有结果只有几种、十几种)为载体,让学生体会并理解概率的意义.
4.为什么删减几何分布而增加超几何分布?
按说学生对几何分布的理解和掌握比超几何分布的理解和掌握更容易,但新课程标准对分布列加了限制“理解取有限值的离散型随机变量及其分布列的概念”,要求“通过实例,理解取有限值的离散型随机变量均值、方差的概念,能计算简单离散型随机变量的均值、方差,并能解决一些实际问题”.从这种意义上说,几何分布中随机变量的取值有无限多个,而超几何分布属于有限多个.
5.考试内容的思考.
本部分内容要求层次为C的有:
用分类加法计数原理或分步乘法计数原理解决一些简单的实际问题、排列数公式、组合数公式、用排列与组合解决一些简单的实际问题、取有限值的离散型随机变量及其分布列、用样本的频率分布估计总体分布,用样本的基本数字特征估计总体的基本数字特征.
要求层次为A的有:
随机事件的概率、超几何分布、条件概率、事件的独立性、正态分布、分层抽样和系统抽样.
由此可见,考查的重点还在于计数原理、排列组合、二项式定理、取有限值的离散型随机变量及其分布列与期望方差,抽样方法侧重于简单随机抽样;而超几何分布、条件概率、正态分布、几何概型、线性回归、随机数的含义与意义等内容则基本不会考查(在复习建议中还有一定的分析).
五、第一轮复习建议
(一)课时建议(总约15课时)
计数原理………………………………………………………………1课时
排列组合………………………………………………………………2课时
二项式定理……………………………………………………………1课时
统计(包括抽样方法、用样本估计总体、变量的相关性)………2课时
随机事件的概率………………………………………………………1课时
古典概型………………………………………………………………1课时
几何概型………………………………………………………………1课时
离散型随机变量及其分布列与数字特征……………………………2课时
条件概率与事件的独立性、正态分布………………………………2课时
统练讲评………………………………………………………………2课时
(二)复习建议
1.抓住重点,贴近高考.
两周时间,非常紧张.所以,复习过程中,既要全面扫描,又要重点突出,以考试说明为准绳.排列组合与二项式定理最多各考查一道小题,因此,复习立足掌握基本的排列组合计数方法和二项展开式的通项公式,不需要在复杂的题目花费太多的时间;统计与概率部分重点是用样本估计总体的思想,会用样本的频率分布与数字特征估计总体的情况,会求古典概型的概率,会求离散型随机变量的分布列与数字特征.
几何概型、超几何分布、正态分布、条件概率、线性回归等内容只要求学生弄清楚其基本知识即可,不必花费太多精力.
2.关注统计基本思想和数据处理能力的考查.
统计的考查不是单纯的数字计算,而是数据处理能力的考查和统计思想的考查.读图、读取数据、借助图表处理数据、分析数据,都不是目的,最终都是为了用样本的情况来估计总体,为作出决策提供参考.考试说明中也增加了“数据处理能力”的要求.因此,统计部分要将数据的收集与整理、数据的处理与分析、数字特征量的计算与估计作为一个整体来把握,立足统计思想的理解和应用.
3.关于排列组合.
排列组合的基本方法有:
直接利用计数原理合理分类准确分步、特殊元素与特殊位置优先考虑、相邻问题捆绑、不邻问题插空、分排问题直排等.最基本的方法是进行分类与分步,恰当运用计数原理进行求解,能掌握排列组合数公式的基本运用.象定序选排法、交叉问题集合法、无差别问题隔板法等不必花费过多时间和精力.
例如,(11北京理12)用数字2,3组成四位数,且数字2,3至少都出现一次,这样的四位数共有__________个.(用数字作答)本题可以分类用排列组合计数,但也可以直接用分步乘法计数原理,共16个,但需去掉全是2或3的两个,故共14个.
4.关于二项式定理.
掌握二项式定理,尤其掌握展开式的通项公式,会求展开式中的特定项或特定项的系数及展开式中各项系数的和,会研究通项来研究项的性质(如有理项),会运用简单的赋值法求一些展开式中代数式的和.对三项或三项以上的展开问题,应根据式子的特点,转化为二项式来解决,转化的方法通常为集项、配方、因式分解,一般不必过多复习.对二项式定理的综合运用,如整除问题、证明问题等,也不必过多花费时间.
例如,(09北京理6)若
为有理数),则a+b=_____.直接考查展开式的通项公式.
5.关于抽样方法.
简单随机抽样、系统抽样、分层抽样有各自的特点和适用范围,考试说明中只有简单随机抽样为B层次,后两种为A.三种抽样方法的基本特点是每个个体被抽得的概率相等.简单随机抽样是系统抽样和分层抽样的基础,有以下特点:
(1)它要求总体个数较少;
(2)它是从总体中逐个抽取的;(3)它是一种不放回抽样.系统抽样又称等距抽样,总体中不能含有一定的周期性,否则其样本的代表性是不可靠的,甚至会导致明显的偏向.抽样方法经常交叉使用,比如系统抽样中的第一均衡部分,可采用简单随机抽样,分层抽样中,若每层中个体数量仍很大时,则可辅之以系统抽样.
6.关于用样本估计总体.
用样本频率分布来估计总体分布的重点是:
频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布,难点是频率分布表和频率分布直方图的理解及应用.
频率分布直方图能够很容易地表示大量数据,非常直观地表明分布的形状,使我们能够看到在分布表中看不清楚的数据模式.但从直方图本身得不出原始的数据内容.频率分布折线图的优点是它反映了数据的变化趋势,如果样本容量不断增大,分组的组距不断缩小,那么折线图就趋向于总体分布的密度曲线.用茎叶图的优点是原有信息不会抹掉,能够展示数据的分布情况,但当样本数据较多或数据位数较多时,茎叶图显得不太方便了.标准差、方差描述了一组数据围绕平均数波动的大小.
要注意:
不要把直方图错认为条形图,两者的区别在于条形图是离散随机变量,纵坐标刻度为频数或频率,直方图是连续随机变量,纵坐标刻度为频率/组距.
例如,(11北京理17)茎叶图可以读取原始的每一个数据;(10北京理11文12)考查的是频率分布直方图;(07北京理18)考查的是条形图,其纵坐标为参加人数.
7.关于线性回归.
这部分隶属于变量的相关性,有散点图、正相关、负相关、线性相关、回归直线等概念,能从散点图判断两个变量的相关性.这部分的主要内容应当是通过对已有数据的分析(画散点图),判断变量的线性相关性,求回归直线方程(公式不要求记忆),再利用回归直线对总体做出估计.线性回归的意义在于“估计”,其重点不在于回归直线的求解.线性回归是回归分析中最简单的一种,回归直线方程一定经过样本中心点(
,
),它是依赖于具体的一组观测值的.根据回归方程进行估计,仅是一个估计而已,而不是真实发生的值.由于计算量较大,计算器又不能带进考场,所以给线性回归的考查带来了不便.所以,教学复习时应着重让学生理解线性回归的意义.
8.关于古典概型.
古典概型是具有以下两个特点的概率模型:
(1)在一次试验中所有可能出现的基本事件只有有限个;
(2)每个基本事件出现的可能性相等.如不能真正把握这两个特点,就有可能会出现一些错误的概率观念,例如,两枚掷骰子所有可能出现的结果是36种,而不是21种(两个点数相同6种,另加
);抛两枚硬币所有可能结果是4种,而不是3种.所以,在分析古典概型中事件的概率时,一定要准确地确定基本事件.
计算古典概型概率时,有时可以用排列模式,也可以用组合模式,只要统一都可以.用列举法一定要不重不漏.事件A的概率的计算方法,关键要分清基本事件总数n与事件A包含的基本事件数m.因此必须解决以下三个方面的问题:
一是本试验是否是等可能的;二是本试验的基本事件数有多少个;三是事件A是什么,它包含的基本事件有多少.
例如,一个袋中有3个红球和5个白球,这些球只可辨颜色,现从中摸出3个球,求三个球同色的概率.一般按组合模式,所有可能的结果有
种,同色的结果有
种,因而概率为11/56;若按排列模式,则所有可能的结果有
种,同色的结果有
种,因而概率为66/336=11/56.
有放回和无放回也是有区别的,如果将本题改为“现从中有放回地摸球3次,每次摸出一个球”,则所有可能的结果为
种,同色的结果有
种,概率为19/64.
此外,解答概率题要特别注意表述.例如,11年北京理17题的表述:
解(I)当X=8时,由茎叶图可知,乙组同学的植树棵数是:
8,8,9,10,
所以平均数为
方差为
(Ⅱ)当X=9时,由茎叶图可知,甲组同学的植树棵树是:
9,9,11,11;乙组同学的植树棵数是:
9,8,9,10.分别从甲、乙两组中随机选取一名同学,共有4×4=16种可能的结果,这两名同学植树总棵数Y的可能取值为17,18,19,20,21事件“Y=17”等价于“甲组选出的同学植树9棵,乙组选出的同学植树8棵”,所以该事件有2种可能的结果,因此P(Y=17)=
同理可得
所以随机变量Y的分布列为:
Y
17
18
19
20
21
P
EY=17×P(Y=17)+18×P(Y=18)+19×P(Y=19)+20×P(Y=20)+21×P(Y=21)=17×
+18×
+19×
+20×
+21×
=19.
9.关于几何概型.
古典概型是针对所有可能结果有限、且每个结果的发生具有等可能性的概率计算模型,几何概型则是针对所有可能结果无限、且每个结果等可能的概率计算模型.在几何概型中计算概率都是用区域的几何度量(长度、面积或体积)进行求解.在有些问题中,我们思考的角度不一样,会导致我们选择的几何度量不一样,从而计算出的概率也不一样,但又都是合理的.如:
(1)在Rt△ABC中,∠A=30°,过直角顶点C作射线CM交线段AB于M,求使|AM|>|AC|的概率.究竟是以角来考虑还是以线段上的点来考虑?
(2)半径为1的圆内弦长超过半径的概率是多少?
以弧长考虑,还是以A所在直径考虑,还是以圆内一点为中点作弦?
弦产生的方式不同,概率也不相同.
另外,有些几何概型题的建模要求很高,例如,甲、乙两人约定在6时到7时之间在某处会面,并约定先到者应等候另一个人20分钟,过时就可离去,试求这两人能会面的概率.(这里详细分析建模过程)
所以,几何概型只适宜要求学生了解其概念,增强一些概率观念,不适宜考查.
10.离散型随机变量及其分布列与数字特征.
所谓随机变量的分布列,就是试验结果和概率之间的一个对应关系,这与函数概念本质上是相同的.只不过在函数概念中,函数f(x)的自变量是实数x,而在随机变量分布列的概念中,随机变量X是试验结果,函数值是相应的概率值.
本部分仅限于有限个取值的离散型随机变量的分布列与数字特征.离散型随机变量X的概率分布(或称为离散型随机变量X的分布列)具有两个性质:
①pi≥0,i=1,2,…,n;②p1+p2+…+pi+…+pn=1.离散型随机变量在某一范围内取值的概率等于它取这个范围内各个值的概率之和.两点分布(独立重复试验后讲二项分布,注意二项分布与两点分布的关系)、超几何分布是典型的离散型随机变量的分布列.
本部分需重点复习,需要让学生学会分析具体问题中随机变量的取值,以及每种情况对应的概率值.掌握计算期望与方程的公式:
,
.
11.关于超几何分布
在含有M件次品的N件产品中,任取n件,其中恰有X件次品,则事件概率为:
P{X=k}=
(k=0,1,2,…m),其中m=min{M,n},且n≤N,M≤N,n,N,M∈N*.
记作X~H(n,M,N),EX=
,DX=
.
一般题M、N值较小,可以直接计算期望与方差,不要求记公式.
令次品率
,则EX=np,DX=
,当N无限大时,
,因而超几何分布可以近似地看作二项分布.
超几何分布的学习不要模式化,也不要去记上面这些公式,实际上不知道超几何分布的模型也可以求解分布列及期望与方差,因此,超几何分布主要是理解其模型,理解它与二项分布的关系,会解决基本的超几何分布的分布列等相关问题.
12.关于条件概率与事件的独立性.
条件概率是一种带有附加条件的概率.是指若事件A与事件B是相依事件,即事件A的概率随事件B是否发生而变化,同样,事件B的概率与随事件A是否发生而变化,则在事件A已发生的条件下,事件B出现的概率称为事件B的条件概率.
.计算条件概率有时也可以用缩小样本空间的方法,用
例如,(波利亚罐子模型)袋子中有3只红球,5只白球,每次从袋中任取一只球,观察颜色后放入袋中,并再放入2只所取球同色的球.若连续取球4次,试求前两次取到红球且后两次取到白球的概率.
解:
用
(i=1,2,3,4)表示事件“第i次取到红球”,
表示事件“第i次取到白球”,则所求概率为:
=
=
=
.解答时不要错误地用独立事件的乘法公式来求解.我们要分清是“AB同时发生”P(AB),还是“在A发生的条件下B发生”P(B|A).事件的独立性是指:
若事件A是否发生对事件B发生的概率没有影响,即
,(
),则称事件A、B相互独立.
有时一个事件的发生与否与另一事件的发生与否是有关系的,因而它们的发生概率也有一定的关系.条件概率的学习就是要让学生明白有些概率的计算是有条件的,并能在此基础上理解事件的独立性.教学时可以结合上例让学生理解条件概率,理解它与独立事件的简洁公式的区别,不必刻意呈现一些较难理解的条件概率计算问题.
13.关于正态分布.
了解正态曲线的性质:
①曲线位于x轴上方,与x轴不相交;
②曲线是单峰的,它关于