第14讲 数据的收集整理 尖子班.docx
《第14讲 数据的收集整理 尖子班.docx》由会员分享,可在线阅读,更多相关《第14讲 数据的收集整理 尖子班.docx(13页珍藏版)》请在冰豆网上搜索。
第14讲数据的收集整理尖子班
第14讲数据的收集、整理和描述
知识点1:
普查和抽样调查
1.普查和抽样调查
普查:
为一特定目的而对所有考查对象所做的调查叫普查.
好处:
调查结果准确;
缺点:
花费多,工作量大,全面调查只在样本很少的情况下适合采用;
抽样调查:
为一特定目的而对部分考查对象所做的调查叫做抽样调查.
好处:
耗费的人力,物力,财力少,工作量小;
缺点:
调查结果不如普查精确,受样本容量大小及其代表性影响较大;
2.总体、个体、样本、样本容量
总体:
所考察对象的全体;
个体:
组成总体的每一个考察对象;
样本:
从总体重所抽取的一部分个体叫做总体的一个样本;
样本容量:
样本中的个体数目;
【典例】
1.下列调查运用哪种调查方式合适?
(1)调查淮河流域的水污染情况;
(2)调查一个村庄所有家庭的年收入情况;
(3)调查某电视剧的收视率;
【方法总结】
适合采用普查方式的调查:
(1)调查结果要求非常准确;
(2)所要调查的个体数量少、调查难度相对不大;
(3)调查无破坏性;
适合采用抽样调查方式的调查:
(1)对调查得结果要求不是十分准确;
(2)调查具有破坏性;
(3)调查的问题所包含的个体数量较多;
(4)调查时间和经费有限,全面调查受到限制;
2.请指出下列抽样凋查中的总体、个体、样本和样本容量.
为了解某所学校的学生参加课外体育活动的情况,调查了其中20名学生每天参加课外体育活动的时间;
【方法总结】
总体是指考查的对象的全体,个体是总体中的每一个考查的对象,样本是总体中所抽取的一部分个体,而样本容量则是指样本中个体的数目.我们在区分总体、个体、样本、样本容量,这四个概念时,首先找出考查的对象.从而找出总体、个体.再根据被收集数据的这一部分对象找出样本,最后再根据样本确定出样本容量.
3.某池塘里养了鱼苗1万条,根据这几年的经验,鱼苗成活率为95%,一段时间后准备打捞出售,第一网捞出40条,称得平均每条鱼重2.5千克,第二网捞出25条,称得平均每条鱼重2.2千克,第三网捞出35条,称得平均每条鱼重2.8千克,试估计这池塘中鱼的质量.
【方法总结】
用样本估计总体时,样本容量越大,越具有代表性,对总体的估计也就越精确.
用样本估计总体,样本选取合适的情况下,
(1)样本平均数=总体平均数.
(2)样本中某一项占样本的比重=总体中该项占总体的比重
本题计算池塘中鱼的总质量可以用抽样方法估算出每条鱼的质量乘以总数即可.
【随堂练习】
1.(2017•丰台区二模)为了解某校初二学生每周上网的时间,两位学生进行了抽样调查,小丽调查了初二电脑爱好者中40名学生每周上网的时间:
小杰从全校400初二学生中随机抽取了40名学生,调查了每周上网的时间.小丽与小杰整理各自样本数据,如表所示.
时间段(小时/周)
小丽抽样(人数)
小杰抽样(人数)
0~1
6
22
1~2
10
10
2~3
16
6
3~4
8
2
(1)你认为哪位同学抽取的样本不合理?
请说明理由.
(2)专家建议每周上网2小时以上(含2小时)的同学应适当减少上网的时间,估计该校全体初二学生中有多少名同学应适当减少上网的时间?
2.(2016•赣州模拟)人类的血型一般可分为A,B,AB,O型四种,宁波市中心血战2015年共有8万人无偿献血,血战统计人员由电脑随机选出20人,血型分别是:
O,A,O,B,O,A,A,AB,A,O,O,B,AB,B,O,A,O,B,O,A.
(1)请设计统计表分类统计这20人各类血型人数;
(2)若每位献血者平均献血200毫升,一年中宁波市各医院O型血用血量约为6×106毫米,请你估计2015年这8万人所献的O型血是否够用?
知识点2:
统计图的选用
常见的统计图有:
扇形统计图、条形统计图和折线统计图.
扇形统计图用圆中各扇形的面积描述各统计项目占总体的百分比;
条形统计图用宽度相同的“条形”的高度描述各统计项目的数据;
折线统计图用折线描述数据的变化过程和趋势.
扇形统计图中,扇形的圆心角=该统计项目占总体的百分比×360°.
在选择制作统计图时,需要根据了解的情况而定:
若要清楚地表示出各统计项目在总体重所占的百分比,则选择扇形统计图;
若要清楚地反映数据的变化过程和趋势,则选择折线统计图;
若要清楚地表示出每个统计项目的具体数据,则选择条形统计图.
【典例】
1.全民健身运动已成为一种时尚,为了了解我市居民健身运动的情况,某健身馆的工作人员开展了一项问卷调查,问卷包括五个项目:
A:
健身房运动;B:
跳广场舞;C:
参加暴走团;D:
散步;E:
不运动.
以下是根据调查结果绘制的统计图表的一部分.
请你根据以上信息,回答下列问题:
(1)接受问卷调查的共有______人,图表中的m=______,n=______;
(2)统计图中,A类所对应的扇形圆心角的度数为______;
(3)根据调查结果,我市市民最喜爱的运动方式是______,不运动的市民所占的百分比是______;
(4)我市碧沙岗公园是附近市民喜爱的运动场所之一,每晚都有“暴走团”活动,若最邻近的某社区约有1500人,那么估计一下该社区参加碧沙岗“暴走团”的大约有多少人?
【方法总结】
本题主要考查扇形统计图与统计表的综合计算.根据公式总体=选取部分数量÷所占比例以及变形便可得出第
(1)(3)问;根据公式扇形的圆心角=该统计项目占总体的百分比×360°便可计算得出第
(2)问;根据用样本估计总体的方法,样本当中该项目占样本容量的百分比与总体中该项目数量占总体的百分比相等即可求出第(4)问.
2.某中学为了解本校学生对球类运动的爱好情况,采用抽样的方法,从乒乓球、羽毛球、篮球和排球四个方面调查了若干名学生,在还没有绘制成功的“折线统计图”与“扇形统计图”中,请你根据已提供的部分信息解析下列问题.
(1)在这次调查活动中,一共调查了________名学生.
(2)“羽毛球”所在的扇形的圆心角是________度.
(3)请补全折线统计图;
(4)若该校有学生1200名,估计爱好乒乓球运动的约有多少名学生?
【方法总结】
本题主要考查扇形图与折线图的综合运用,解题关键在于扇形统计图各部分(项目)与折线图的对应.同一个部分用折线图给出的数据除以扇形图的比例即可算出调查的总体或者样本容量;用扇形统计图某个项目的比例乘以360°即可计算出所对应的圆心角度数;某一个项目在样本中所占的比例等于在总体中所占的比例.
【随堂练习】
1.(2018•绥阳县模拟)某校九年级开展征文活动,征文主题只能从“爱国”“敬业”“诚信”“友善”四个主题选择一个,九年级每名学生按要求都上交了一份征文,学校为了解选择各种征文主题的学生人数,随机抽取了部分征文进行了调查,根据调查结果绘制成如下两幅不完整的统计图.
(1)求共抽取了多少名学生的征文;
(2)将上面的条形统计图补充完整;
(3)在扇形统计图中,选择“爱国”主题所对应的圆心角是多少;
(4)如果该校九年级共有1200名学生,请估计选择以“友善”为主题的九年级学生有多少名.
2.(2018•道外区三模)随着通讯技术迅猛发展,人与人之间的沟通方式更多样、便捷.某校数学兴趣小组设计了“你最喜欢的沟通方式”调查问卷(每人必选且只选一种),在全校范围内随机调查了部分学生,将统计结果绘制了如下两幅不完整的统计图,请结合图中所给的信息解答下列问题:
(1)这次统计共抽查了_____名学生;在扇形统计图中,表示“QQ”的扇形圆心角的度数为_____;
(2)将条形统计图补充完整;
(3)该校共有1500名学生,请估计该校最喜欢用“微信”进行沟通的学生有多少名?
知识点3:
频数和频率
频数:
某个对象出现的次数称为该对象的频数,各频数之和为试验的总次数.
频率:
频数与总次数的比值称为频率.
【典例】
【选择题】
【题干】袋子里有4个黑球,m个白球,它们除颜色外都相同,经过大量实验,从中任取一个球恰好是白球的频率是0.20,则m的值是____
【方法总结】
根据频数、频率的概念以及频数与总数的关系计算即可.
【随堂练习】
1.(2018•吴中区一模)一次数学测试后,某班50名学生的成绩被分为5组,第1~4组的频数分别为12、10、15、8,则第5组的频率是( )
A.0.1B.0.2C.0.3D.0.4
2.(2018春•蒙阴县期末)三河中学在全县中学生运动会上,共派出了30名运动员,占所有运动员总数的5%,则这次运动会全县共有____名运动员.
3.(2018春•淮安区期中)小花最近买了三本课外书,分别是《汉语字典》用A表示,《流行杂志》用B表示和《故事大王》用C表示.班里的同学都很喜欢借阅,在五天内小花做了借书记录如下表:
书名
代号
借阅
频数
星期一
星期二
星期三
星期四
星期五
A
3
2
2
3
4
14
B
4
3
3
2
3
15
C
1
2
3
2
3
11
(1)在表中填写五天内每本书的借阅频数.
(2)计算五天内《汉语字典》的借阅频率.
知识点4:
频数分布表和频数分布直方图
1.频数分布表
(1)在统计数据时,经常把数据按照不同的范围分成几个组,分成的组的个数称为组数,每一组两个端点的差称为组距,称这样画出的统计图表为频数分布表.
(2)列频数分布表的步骤:
①计算极差,即计算最大值与最小值的差.
②决定组距与组数(一般100以内的数据分成5~12组).
③决定分点,常使分点比数据多一位小数,并且把第一组的起点稍微减小一些.
④列频数分布表.
组数的决定方法:
设数据总数目为n,一般地,当n≤50时,分为5~8组;当50≤n≤100时,则分为8~12组.
分点的决定方法:
若数据为整数,则分点数据减去0.5;若数据是保留小数点后的一位数,则分点数据减去0.05.
2.频数分布直方图
画出频数分布表以后,构造一个坐标系,用横轴表示各组数据,纵轴表示频数,以该组内的频数为高,组距为宽,画一个长方形,每组两端的数据也可以用中位数来代替.各小组的频数之和等于数据总数.
【典例】
1.一组数据的最大值与最小值的差为80,若确定组距为9,则分成的组数为_____
【方法总结】
根据组数=(最大值﹣最小值)÷组距计算,注意小数部分要进位.
2.某校从初二年级抽出40名女生的身高数据,分组整理出如下频数分布表:
表中a,b,c分别是( )
【方法总结】
由“频率=频数÷总数”及“频数之和等于总数”可得答案.
【随堂练习】
1.(2018春•灌云县期末)对50个数据进行统计,频率分布表中,54.5~57.5这一组的频率为0.12.那么估计总体数据落在54.5~57.5之间的约有( )
A.12个B.60个C.12个D.6个
2.(2018春•宿松县期末)为了了解学校开展“孝敬父母,从家务劳动做起”活动的实施情况,该校抽取八年级50名学生,调查他们一周(按七天计算)做家务所用时间(单位:
小时)得到一组数据,绘制成下表:
时间x(小时)
划记
人数
所占百分比
0.5x≤x≤1.0
正正
14
28%
1.0≤x<1.5
正正正
15
30%
1.5≤x<2
7
14%
2≤x<2.5
4
8%
2.5≤x<3
正
5
10%
3≤x<3.5
3
6%
3.5≤x<4
2
4%
合计
50
100%
(1)请填表中未完成的部分;
(2)根据以上信息判断,每周做家务的时间不超过1.5小时的学生所占的百分比是多少?
(3)针对以上情况,写出一个20字以内的倡导“孝敬父母,热爱劳动”的句子.
综合运用
1.空气使由多种气体混合而成,为了简明扼要地说明空气的组成情况,最好用 ___________统计图.
2.为了解植物园内某种花卉的生长情况,在一片约有3000株此类花卉的园地内,随机抽测了200株的高度作为样本,统计结果整理后列表如下:
(每组数据可包括最低值,不包括最高值)
试估计该园地内此类花卉高度小于55厘米且不小于45厘米的约为_________株.
3.某中学抽取部分学生对“你最喜欢的球类运动”调查问卷,收集整理数据后列频数频率分布表(部分)如下(其中m,n为已知数):
则mn的值为_________.
3.如图,为了解全校300名男生的身高情况,随机抽取若干男生进行身高测量,将所得数据(精确到1cm)整理画出频数分布直方图(每组数据含最低值,不含最高值),估计该校男生的身高在170cm﹣175cm之间的人数约有_________人.
4.指出下列调查中的总体、个体、样本和样本容量.
从学校七年级中抽取30名学生,调查学校七年级学生每周用于做数学作业的时间.
5.某学校为了解本校八年级学生生物考试测试情况,随机抽取了本校八年级部分学生的生物测试成绩为样本,按A(优秀)、B(良好)、C(合格)、D(不合格)四个等级进行统计,并将统计结果绘制成如下统计图表.请你结合图表中所给信息解析下列问题:
(1)请将上面表格中缺少的数据补充完整;
(2)扇形统计图中“A”部分所对应的圆心角的度数是___________;
(3)该校八年级共有1200名学生参加了身体素质测试,试估计测试成绩合格以上(含合格)的人数.
6.网瘾低龄化问题已经引起社会各界的高度关注,有关部门在全国范围内对12﹣35岁的网瘾人群进行了简单的随机抽样调查,绘制出以下两幅统计图.
请根据图中的信息,回答下列问题:
(1)这次抽样调查中共调查了___________人;
(2)请补全条形统计图;
(3)扇形统计图中18﹣23岁部分的圆心角的度数是___________;
(4)据报道,目前我国12﹣35岁网瘾人数约为2000万,请估计其中12﹣23岁的人数.
7.下列图表是2017年某校从参加中考体育测试的九年级学生中随机调查的10名男生跑1000米和10名女生跑800米的成绩.
(1)按规定,女生跑800米的时间不超过3'24“就可以得满分.该校九年级学生有490人,男生比女生少70人.请你根据上面成绩,估计该校女生中有多少人该项测试成绩得满分?
(2)假如男生1号和男生10号被分在同组测试,请答案他俩在400米的环形跑道测试的过程中能否相遇.若能,求出发多长时间才能相遇;若不能,说明理由.
8.为给研究制定《中考改革实施方案》提出合理化建议,教研人员对九年级学生进行了随机抽样调查,要求被抽查的学生从物理、化学、政治、历史、生物和地理这六个选考科目中,挑选出一科作为自己的首选科目,将调查数据汇总整理后,绘制出了如图的两幅不完整的统计图,请你根据图中信息解析下列问题:
(1)被抽查的学生共有多少人?
(2)将折线统计图补充完整;
(3)我市现有九年级学生约40000人,请你估计首选科目是物理的人数.
9.某校组织九年级学生参加汉字听写大赛,并随机抽取部分学生成绩作为样本进行答案,绘制成如下的统计表:
九年级抽取部分学生成绩的频率分布表
请根据所给信息,解析下列问题:
(1)a=_________,b=_________;
(2)请补全频数分布直方图;
(3)已知该年级有400名学生参加这次比赛,若成绩在90分以上(含90分)的为优,估计该年级成绩为优的有多少人?