第十九讲 数据的收集与整理Word文档格式.docx
《第十九讲 数据的收集与整理Word文档格式.docx》由会员分享,可在线阅读,更多相关《第十九讲 数据的收集与整理Word文档格式.docx(13页珍藏版)》请在冰豆网上搜索。
用线段从左到右将这些点依次连接起来.
(4)频数分布直方图
用频数分布直方图描述数据的一般步骤为:
计算最大值与最小值的差;
确定组距与组数;
决定分点;
列数频分布表;
画频数分布直方图.
①把数据按一定的规律分成组的个数为组数,每一组两个端点的差称为组距.
;
②数据分组时,对数据要遵循“不重不漏”的原则,既不能有一个数据同时落在两个组内重复出现的现象,也不能有一个数据不在任何组内的遗漏现象;
③频数分布直方图能够显示各组频数的分布情况,易于显示各组之间频数的差别.
(5)频数折线图
频数折线图可以在频数分布直方图的基础上画出来.取频数分布直方图中每一个矩形上边的中点,然后在横轴上取两个频数为0的点,即在直方图的左边和右边各取一个频数为0的点,再用线段从左到右将这些点依次连接起来.
说明利用统计图表示经过整理的数据,能更直观地反映数据规律.
(1)条形图:
能显示具体数据,易于比较数据差别;
(2)扇形图:
用扇形的面积占圆的面积的百分比表示部分在总体中所占百分比,易于显示每组数据相对于总体的大小;
(3)折线图:
易于显示数据的变化趋势;
(4)直方图:
能显示各组频数分布的情况,易于显示各组之间频数的差别.
(二)数据的分析
1.平均数、众数与中位数
(1)算术平均数
(2)加权平均数
如果一组数据中,x1,x2,x3,…,xk出现的次数分别是f1,f2,f3,…,fk,那么这组数据的加权平均数
(3)众数与中位数
①在一组数据中,出现次数最多的数据叫做这组数据的众数(一组数据的众数有时不止一个);
②将一组数据按从小到大(或从大到小)的顺序排列,把处在最中间的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数;
③众数、中位数和平均数从不同的角度描述了一组数据的集中趋势.
(4)平均数、中位数、众数的特征
①平均数、中位数和众数都是数据的代表,它们刻画了一组数据的平均水平;
②平均数容易受极端值的影响,而中位数则不能充分利用所有数据的信息,众数在各个数据的重复次数大致相等时往往没有特别的意义.
2.极差和方差、标准差
(1)极差:
一组数据中数据最大值减去最小值的差叫做这组数据的极差.
①极差用来反映一组数据变化范围的大小,是刻画数据离散程度的最简单的统计量;
②极差受极端值的影响较大,不能反映中间数据的离散情况.
(2)方差:
在一组数据x1,x2,x3,…,xn中,各数据与它的平均数
的差的平方和的平均数叫做这组数据的方差,即
①方差是用来反映一组数据波动情况的特征数,常常用来比较两组数据的波动大小,方差越大,数据的波动越大;
方差越小,数据的波动越小;
②方差的单位是原数据单位的平方.
(3)标准差:
一组数据的方差的算术平方根叫做这组数据的标准差,即
*标准差的计算公式:
说明
(1)一组数据的众数可以不唯一,但一定出现在这组数据中;
而一组数据的其他统计量都是唯一的,但未必出现在这组数据中;
(2)一组数据都在常数a上下波动,即x'
1=x1+a,x2'
=x2+a,…,xn'
=xn+a时,平均数
方差s'
2=s2.
二、例题分析
例1下列调查方式,合适的是().
A.要了解一批灯泡的使用寿命,采用普查方式
B.要了解甘肃电视台“陇原风貌”栏目的收视率,采用普查方式
C.要保证“神舟六号”载人飞船成功发射,对重要零部件的检查采用抽查方式
D.要了解人们对环境的保护意识,采用抽查方式
解D.
说明当一项调查具有破坏性或以现有的人力、物力、财力很难(或没有必要)进行普查时,就选择抽查,对像“神舟六号”重要零部件的检查这类调查则必须选择普查.
例2某校对1200名女生的身高进行了测量,身高在1.58~1.63(单位:
m)这一小组的频率为0.25,则该组的人数为().
A.150人B.300个C.600人D.900人
分析1200名女生就有1200个身高,故数据总数为1200.同理,该组的人数即为落在该组的数据个数,即该组的频数.由频率=频数÷
数据总数得,频数=频率×
数据总数=0.25×
1200=300.故该组的人数为300人.故选B.
说明对频数与频率的考查大多数放置于数据处理的背景之下,侧重于对概念的理解与运用,单独考查时一般以填空和选择的题型出现,但更多的是与统计图等结合考查.
例3我市某一周的最高气温统计如下表:
最高气温(℃)
25
26
27
28
天数
1
2
3
则这组数据的中位数与众数分别是().
A.27℃,28℃B.27.5℃,28℃
C.28℃,27℃D.26.5℃,27℃
分析由上表可知,一共统计了7个数据,将它们按从小到大排列为25,26,27,27,28,28,28,第4个数据是27,故这组数据的中位数是27(℃).又数据28出现的次数最多,所以众数是28(℃).故选A.
说明
(1)求中位数时,先看这组数据的个数是奇数还是偶数,然后将这组数据按从小到大的顺序排列.若有奇数个数据,则最中间那个数据就是这组数据的中位数;
若有偶数个数据,则最中间两个数据的平均数即是这组数据的中位数;
(2)求众数时,先数出各数据在这组数据中出现的次数,出现次数最多的数据就是这组数据的众数.有时一组数据的众数不只一个.
例4某单位欲从内部招聘管理人员一名,对甲、乙、丙3名候选人进行了笔试和面试两项测试,3人的测试成绩如下表所示:
测试项目
测试成绩/分
甲
乙
丙
笔试
75
80
90
面试
93
70
68
图19-1
根据录用程序,组织200名职工对三人利用投票推荐的方式进行民主评议,三人得票率(没有弃权票,每位职工只能推荐1人)如图19-1所示,每得一票记作1分.
(1)请算出三人的民主评议得分;
(2)如果根据三颂测试的平均成绩确定录用人选,那么谁将被录用(精确到0.01)?
(3)根据实际需要,单位将笔试、面试、民主评议三项测试得分按的4∶3∶3比例确定个人成绩,那么谁将被录用?
解
(1)三人民主评议的得分分别为:
甲200×
25%=50(分),乙200×
40%=80(分),丙200×
35%=70(分).
(2)按三项平均成绩计算,甲的成绩是
(75+93+50)≈72.67,乙的成绩是
(80+70+80)≈76.67,丙的成绩是
(90+68+70)=76.00.乙的成绩最高,他将被录用.
(3)若笔试、面试、民主评议三项测试得分按4∶3∶3的比例确定,三人的成绩分别为:
丙的成绩最高,他将被录用.
说明
(1)计算加权平均数,随着权数的不同,结果可能不同.权数最大的数据对平均数的结果影响最大;
(2)在实际问题中,往往采用加权平均数算法,而很少用算术平均数的算法.
例5甲、乙两同学近期5次百米跑测试成绩的平均数相同,甲同学成绩的方差
=4,乙同学成绩的方差
=3.1,则对他们测试成绩的稳定性判断正确的是().
A.甲的成绩较稳定
B.乙的成绩较稳定
C.甲、乙成绩的稳定性相同
D.甲、乙成绩的稳定性无法比较
分析因为方差越小,波动就越小,且
>
,所以乙同学的成绩波动就小,即乙的成绩较稳定.故选B.
说明中考对极差、方差和标准差这三个统计量的考查,主要侧重于在实际情景中对其意义的理解,以及根据统计结果做出合理的判断和预测.
例6某校从甲、乙两名优秀选手中选择一名选手参加全市中学生田径百米比赛,该校预先对这两名选手测试了8狄,测试成绩如下表:
(单位:
s)
4
5
6
7
8
甲选手的成绩
12.1
12.2
13.0
12.5
13.1
12.4
乙选手的成绩
12.0
12.8
12.3
根据测试成绩,请你运用所学过的统计知识做出判断,派哪一位选手参加比赛更好?
为什么?
解通过计算,可得
=12.5,
=0.12,
=0.1025.
∵
=
,∴两位选手的平均成绩相等.
又∵
,∴乙选手的成绩更稳定.
因此应该派乙选手去参加比赛.
说明
(1)当用求平均数的方法(包括众数和中位数)无法比较两组数据的集中趋势时,还要用方差(包括极差)进一步比较两组数据的波动情况;
看谁的波动小,就说明谁更稳定.
(2)变式练习:
在一次毕业考试中,某校九年级
(1)、
(2)两班学生数学成绩统计如下表:
分数
50
60
100
人
(1)班
16
11
12
数
(2)班
13
请你根据所学的统计知识,分别从①平均数;
②众数;
③方差等不同的角度判断,综合分析这两个班中哪个班的考试成绩更加优秀.
解通过观察和计算,
九年级
(1)班:
平均数80,众数70,方差244;
九年级
(2)班:
平均数80,众数90,方差180.
从平均数看,两个班考试成绩相当,不分优劣;
从众数看
(2)班成绩较好;
从方差看
(2)班成绩较稳定;
综上所述
(2)班成绩更加优秀.
(3)比较的角度不同,所得结论不一定相同.
三、课标下新题展示
例7某校为了解九年级学生体育测试成绩情况,以九年
(1)班学生的体育测试成绩为样本,按A,B,C,D四个等级进行统计,并将统计结果绘成如下两幅统计图(见图19-2),请你结合图中所给信息解答下列问题:
图19-2
(说明:
A级:
90分~100分;
B级:
75分~89分;
C级:
60分~74分;
D级:
60分以下)
(1)求出D级学生的人数占全班总人数的百分比;
(2)求出扇形统计图中C级所在的扇形圆心角的度数;
(3)该班学生体育测试成绩的中位数落在哪个等级内;
(4)若该校九年级学生共有500人,请你估计这次考试中A级和B级的学生共有多少人?
解
(1)4%;
(2)72°
(3)B;
(4)依题意知:
A级和B级学生的人数和占全班总人数的76%,500×
76%=380,所以估计这次考试中A级和B级的学生共有约380人.
例8在第49届世界乒乓球锦标赛中,男子单打决赛在我国选手马琳和王励勤之间展开.双方苦战七局,最终王励勤以4∶3获得胜利.七局比分如下表:
局数
得分
姓名
一
二
三
四
五
六
七
马琳
9
王励勤
(1)请将七局比分的相关数据的分析结果直接填入下表中(结果保留两个有效数字).
项目
分析
结果
平均分
众数
中位数
8.7
9.0
(2)中央电视台在此次现场直播时,开展了“短信互动,有奖竞猜”活动,凡是参与短信互动且预测结果正确的观众,都能参加“乒乓大礼包”的抽奖活动.据不完全统计,有32320名观众参与了此次短信互动活动,其中有50%的观众预测王励勤获胜.刘敏同学参加了本次“短信互动”活动,并预测了王励勤获胜,如果从中抽取20名幸运观众,并赠送“乒乓大礼包”一份,那么刘敏同学中奖概率有多大?
解
(1)马琳得分的众数为11;
王励勤得分的平均数为9.7,中位数为11.
(2)根据题意,预测正确的观众总数为32320×
50%=16160,他们成为幸运观众的可能性相同,而幸运观众数为20,故刘敏中奖的概率为
四、课标考试达标题
(一)选择题
1.某课外兴趣小组为了解所在地区老年人的健康状况,分别作了四种不同的抽样调查.你认为抽样比较合理的是().
A.在公园调查了1000名老年人的健康状况
B.在医院调查了1000名老年人的健康状况
C.调查了10名老年邻居的健康状况
D.利用派出所的户籍网随机调查了该地区10%的老年人的健康状况
2.图19-3中,用来表示不同品种的奶牛的平均产奶量最为合适的是().
图19-3
3.某地今年1月1~4日每天的最高气温与最低气温如下表:
日期
1月1日
1月2日
1月3日
1月4日
最高
气温
5℃
4℃
0℃
最低
-2℃
-4℃
-3℃
其中温差最大的是().
A.1月1日B.1月2日
C.1月3日D.1月4日
4.已知样本x1,x2,x3,x4的平均数是2,则x1+3,x2+3,x3+3,x4+3的平均数为().
A.2B.2.75C.3D.5
5.数学老师对小明参加的四次中考数学模拟考试成绩进行统计分析,判断小明的数学成绩是否稳定,因此老师需要知道小明这四次数学成绩的().
A.平均数B.众数C.中位数D.方差6.在1000个数据中,用适当的方法抽取了50个数据作为样本进行统计.频率分布表中,
在54.5~57.4这一组的频率是0.12,那么估计总体落在这一组之间的数据有().
A.120个B.60个C.12个D.6个
(二)填空题
7.在扇形统计图中,占圆12%的扇形的圆心角是______°
,圆心角是144°
的扇形占它所在圆的面积的______(填百分数).
8.班主任为了解学生周末在家的学习情况,家访了班内的六位学生,了解到他们在家的学习时间如下表所示.那么这六位学生学习时间的众数是______,中位数是______.
学生姓名
小丽
小明
小颖
小华
小乐
小恩
学习时间
(小时)
9.数据-2,-1,0,1,2的方差是______.
10.某生物小组11人到校外采集植物标本,其中有2人每人采集到6件,有4人每人采集到3件,有5人每人采集到4件,则这个小组平均每人采集标本______件.
(三)解答题
11.宁波港是一个多功能、综合性的现代化大港,年货物吞吐量位居中国内地第二、世界排名第五,成功跻身于国际大港行列.如图19-4是宁波港1994年至2004年货物吞吐量统计图.
图19-4
(1)从统计图中你能发现哪些信息,请说出两个;
(2)有人判定宁波港货物吞吐量每两年间的增长率都不超过30%,你认为他的说法正确吗?
请说明理由.
12.某校初一年级学生每人都只使用甲、乙、丙三种品牌中的一种计算器,图19-5是该年级全体学生使用3种不同品牌计算器人数的频率分布直方图.
图19-5
(1)求该校初一年级学生的总人数;
(2)你认为哪种品牌计算器的使用频率最高?
并求出这个频率.
(3)通过以上统计结果,请你给为学校供货的商家提出一条进货的合理化建议.
参考答案
1.D.2.D.3.D.4.D.5.D.6.A.
7.43.2,40%.8.4,4.5.9.2.10.4.
11.
(1)略;
(2)不对;
比如1994年到1996年的年增长率为30.6%,超过了30%.
12.
(1)20+60+120=200(人);
(2)丙牌使用频率最高,为
=60%;
(3)多进丙牌计算器.