统计与概率.docx
《统计与概率.docx》由会员分享,可在线阅读,更多相关《统计与概率.docx(9页珍藏版)》请在冰豆网上搜索。
统计与概率
统计与概率
主讲:
童丽丹
一、知识要点概述
(一)数据的描述与分析
1、基本知识
(1)几种常见的统计图:
①折线图 ②条形图 ③扇形图 ④直方图
(2)掌握几种常见统计图的优越性
(3)总体:
考查对象的全体.
个体:
总体中每一个被考察的对象.
样本:
从总体中抽取一部分个体组成总体的一个样本.
样本容量:
样本中个体的数目.
2、基本规律
数据的描述方式主要有统计图与统计表两种形式,其中统计图有折线图、条形图、扇形图、直方图四种形式,它们都有各自的优势,折线图可以反映一组数据的变化趋势,条形图易于比较数据之间的差别,扇形图易于显示每组数据相对于总数大小,直方图易于显示各组之间频数的差别,在描述数据时要根据具体情况来选择合适的统计图表,在分析统计图时要考虑到统计图的特征与实际需要.
(二)数据的特征
1、平均数
(1)如果有n个数x1,x2,…,xn,则
叫这n个数的平均数.
(2)求平均数的常用方法
设所给出的n个数据x1,x2,x3,…,xn-1,xn,求它们的平均数
.
①基本方法:
②新数据法:
当x1,x2,…,xn-1,xn数据较大时,选择一个与这些数比较接近的数a,令
先计算这组新数据x1′,x2′,…,x′n的平均数
③加权法:
若x1出现f1次,x2出现x2次,…,xk出现fk次,且f1+f2+…+fk=n,则
.
④新数据加权法:
新数据同②,若x1′出现f1次,x′2出现f2次,……
出现fk次,且f1+f2+…+fk=n.
.
2、中位数、众数、极差
(1)中位数:
将一组数据按大小依次排列,把处在正中间位置的一个数据(或最中间两个数据的平均数)叫这组数据的中位数.
(2)众数:
在一组数据中,出现次数最多的数据叫这组数据的众数.
(3)极差:
一组数据的最大数与最小数据之差.
3、方差、标准差
(1)方差:
样本中各数据与样本平均数的差的平方的平均数叫样本方差.
(2)标准差:
样本方差的算术平方根叫做样本标准差.
(3)求方差的方法
①设n个数据x1,x2,…,xn的平均数为
,则其方差
②当数据比较大时,仿前面选择一个适当的常数a,得一组新数据
,则方差
.
(4)样本方差和样本标准差都是衡量一个样本波动大小的量,样本方差或标准差越大,样本数据波动越大.
4、基本规律
(1)反映一组数据的集中程度的统计量主要有平均数、中位数、众数这三种;而反映一组数据的离散程度的统计量有极差、方差、标准差三种,在对一组数据进行分析时,要考虑到分析的目的,再来选择合适的统计量来作出合理的分析,为正确的决策提供依据.
(2)统计在日常生活中得到最广泛的应用,在利用统计的结果进行估计总体或利用统计的结果进行决策时要注意决策的目的和决策的实际意义.
(三)概率
(1)事件按发生可能性的大小分为不可能事件、必然事件和随机事件.
(2)事件发生的可能性的大小可以用概率来衡量.
(3)获取某一事件发生的概率的大小的方法有实验法和分析法.
(4)概率的计算法为列表法和画树状图法;在计算概率时,我们关注的是所有机会均等的结果和我们所关注的结果,求出后者与前者的比值,从而求出某一事件的概率;通过用替代物模拟实验获取概率,应注意实验次数对概率的准确性的影响,实验次数越多,得到的实验数据与实际就越接近.
二、典型例题剖析
例1、为了了解一批电视机的寿命,从中抽取100台电视机进行试验,这个问题中的样本是( )
A.这批电视机的寿命
B.抽取的100台电视机
C.100
D.抽取的100台电视机的寿命
分析:
本题考查的对象是电视机的寿命,故排除B、C,而A说法反映的是电视机总体的寿命,不是样本电视机的寿命,也应排除.
答案:
D
例2、某省有7万名学生参加毕业会考,要想了解这7万名学生的数学成绩,从中抽取了1000名学生的数学成绩进行统计分析,以下说法正确的是( )
A.这1000名学生是总体的一个样本
B.每位考生的数学成绩是个体
C.7万名考生是总体
D.1000名考生是样本容量
分析:
总体是7万名考生的数学成绩的全体,故C项错误,样本应是1000名考生的数学成绩,所以A项错误,而样本容量只是个数据,不带单位,则D项也错.
答案:
B
例3、第十届全国青年歌手大奖赛的12位评委为某位歌手打分的情况如下:
(单位:
分)
则下列结论不正确的是( )
A.这组数据的众数为98.5
B.这组数据的中位数为98.2
C.这组数据的中位数为98.1和98.3
D.去掉一个最高分99.2,去掉一个最低分96.5,这位歌手的最后平均得分为98.12分
分析:
本题中98.5出现次数最多是众数,故A项正确;将这组数据按从小到大排列,由于12个数据,属偶数个数,则正中间两个数的平均数为中位数;取第6,7两数的平均数即
,所以B项也正确;去掉一个最低分,去掉一个最高分,所计算的平均分为98.12分,则D项正确,故C项错误.
答案:
C
例4、某中学为了了解全校的耗电情况,抽查了10天中全校每天的耗电量.数据如下表(单位:
度)
度数
90
93
102
113
114
120
天数
1
1
2
3
1
2
(1)写出上表中数据的众数和平均数.
(2)由上题获得的数据,估计该校某月的耗电量(按30天计)
(3)若当地每度电的定价是0.5元,写出该校应付电费y(元)与天数x(x取正整数,单位:
天)之间的函数关系式.
解:
(1)显然113出现了3次,是出现次数最多的数,故113是众数.
平均数为
.
(2)根据平均数估计某月共耗电量为:
108×30=3240(度).
(3)y=0.5×180x 即y=54x(x为正整数).
例5、某校从甲、乙两名优秀选手中选1名选手参加全市中学生田径百米比赛.该校预先对这两名选手测试了8次,测试成绩如下表:
1
2
3
4
5
6
7
8
选手甲的成绩(秒)
12.1
12.2
13
12.5
13.1
12.5
12.4
12.2
选手乙的成绩(秒)
12
12.4
12.8
13
12.2
12.8
12.3
12.5
根据测试成绩,请你运用所学过的统计知识做出判断,派哪一位选手参加比赛更好?
为什么?
分析:
方差的大小能反映一组数据波动大小,本题应用样本方差的大小来衡量甲、乙两名优秀选手百米比赛成绩的稳定性.
解:
例6、已知一组数据x1,x2,x3,x4,x5的平均数是2,方差是
.那么另一组数据3x1-2,3x2-2,3x3-2,3x4-2,3x5-2的平均数和方差分别是( )
分析:
如果一组数据比原数据分别大(或小)相同的数,则这两组数据的方差相同;如果一组新数据是原数据的n倍,则新数据方差是原数据方差的n2倍.
解:
因为本题中新数据比原数据的3倍小2,则其平均数为3×2-2=4,方差为
故选D.
例7、为了了解初三毕业生的体能情况,某校抽取了一部分初三毕业生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小组的小长方形的面积之比是:
2︰4︰17︰15︰9︰3.
第二小组的频数为12.
(1)填空:
第二小组的频率是__________,在这个问题中,样本容量是__________.
(2)若次数在110以上(含110次)为达标,试估计该校初三毕业生的达标率约是多少?
(3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?
请说明理由.
解:
(1)第二小组的频率为
.
样本容量=频数÷频率=12÷0.08=150.
(2)因为次数在110以上(含110)为达标,故除第一、二两小组不达标以外,其余几个小组均达标,所以达标率为
.
(3)依次可求得第一、二、三、四小组频数依次为6,12,51,45,前三组频数之和为69,前四组频数之和为114,所以中位数落在第四小组内.
例8、下图
(1)是某班学生外出乘车、步行、骑车的人数分布直方图和扇形分布图.
(1)求该班有多少名学生?
(2)补上步行分布直方图的空缺部分.
(3)在扇形统计图中,求骑车人数所占的圆心角度数.
(4)若全年级有500人,估计该年级的步行人数.
分析:
从直方图与扇形图可以发现该班乘车有20人,占总人数的50%,由此可以求出该班的总人数;补充图中步行的直方图,必须求出该班步行的人数,而求圆心角的度数可以用骑车所占的百分比乘以360°.估计全年级的步行人数可以用样本估计总体的方法,用全年级的总人数乘以20%即可.
解:
(1)20÷50%=40(人)
(2)见下图
(3)
.
(4)估计该年级步行人数=500×20%=100(人).
例9、某中学七年级有6个班,要从中选2个班代表学校参加某项活动,七
(1)班必须参加,另外再从七
(2)班至七(6)班选出1个班,七(4)班有学生建议用如下的方法:
从装有编号为1,2,3的三个白球A袋中摸出一个球,再从装有编号为1,2,3的三个红球袋中摸出一个球(两袋中球的大小、形状与质量完全一样),摸出的两个球上的数字之和是几,就选几班.你认为这种方法公平吗?
说明理由.
分析:
方法公平与否,可以通过比较每一种情况所出现的概率来说明.
解:
方法不公平.
用树状分析图来说明.
所以七
(2)班被选中的概率为
;七(3)班被选中的概率为
;七(4)班被选中的概率为
;七(5)班被选中的概率为
;七(6)班被选中的概率为
.