数据分析复习.docx
《数据分析复习.docx》由会员分享,可在线阅读,更多相关《数据分析复习.docx(30页珍藏版)》请在冰豆网上搜索。
数据分析复习
统计与概率——数据的分析与处理1
一.选择题(共8小题)
1.下列调查中,适合用普查方式的是( )
A.调查佛山市市民的吸烟情况
B.调查佛山市电视台某节目的收视率
C.调查佛山市市民家庭日常生活支出情况
D.调查佛山市某校某班学生对“文明佛山”的知晓率
2.今年我市有4万名学生参加中考,为了了解这些考生的数学成绩,从中抽取2000名考生的数学成绩进行统计分析.在这个问题中,下列说法:
①这4万名考生的数学中考成绩的全体是总体;②每个考生是个体;③2000名考生是总体的一个样本;④样本容量是2000.
其中说法正确的有( )
A.4个B.3个C.2个D.1个
3.每年4月23日是“世界读书日”,为了了解某校八年级500名学生对“世界读书日”的知晓情况,从中随机抽取了50名学生进行调查.在这次调查中,样本是( )
A.500名学生
B.所抽取的50名学生对“世界读书日”的知晓情况
C.50名学生
D.每一名学生对“世界读书日”的知晓情况
4从总体中抽取一部分数据作为样本去估计总体的某种属性.下面叙述正确的是( )
A.样本容量越大,样本平均数就越大
B.样本容量越大,样本的方差就越大
C.样本容量越大,样本的极差就越大
D.样本容量越大,对总体的估计就越准确
5.青蛙是我们人类的朋友,为了了解某池塘里青蛙的数量,先从池塘里捕捞20只青蛙,作上标记后放回池塘,经过一段时间后,再从池塘中捕捞出40只青蛙,其中有标记的青蛙有4只,请你估计一下这个池塘里有多少只青蛙?
( )
A.100只B.150只C.180只D.200只
6.如图是交警在一个路口统计的某个时段来往车辆的车速(单位:
千米/时)情况.则这些车的车速的众数、中位数分别是( )
A.8,6B.8,5C.52,53D.52,52
7.如图分别是某班全体学生上学时乘车、步行、骑车人数的分布直方图和扇形统计图(两图都
不完整),下列结论错误的是( )
A.该班总人数为50人B.步行人数为30人
C.乘车人数是骑车人数的2.5倍D.骑车人数占20%
8.为积极响应南充市创建“全国卫生城市”的号召,某校1500名学生参加了卫生知识竞赛,成绩记为A、B、C、D四等.从中随机抽取了部分学生成绩进行统计,绘制成如图两幅不完整的统计图表,根据图表信息,以下说法不正确的是( )
A.样本容量是200
B.D等所在扇形的圆心角为15°
C.样本中C等所占百分比是10%
D.估计全校学生成绩为A等大约有900人
二.填空题(共7小题)
9.在开展“国学诵读”活动中,某校为了解全校1300名学生课外阅读的情况,随机调查了50名学生一周的课外阅读时间,并绘制成如图所示的条形统计图.根据图中数据,估计该校1300名学生一周的课外阅读时间不少于7小时的人数是 _________ .
10.如图,某校根据学生上学方式的一次抽样调查结果,绘制出一个未完成的扇形统计图,若该
校共有学生700人,则据此估计步行的有 _________ 人.
11.某校九年级有560名学生参加了市教育局举行的读书活动,现随机调查了70名学生读书的数量,根据所得数据绘制了如图的条形统计图,请估计该校九年级学生在此次读书活动中共读书 _________ 本.
12.某学校计划开设A、B、C、D四门校本课程供全体学生选修,规定每人必须并且只能选修其中一门,为了了解各部门课程的选修人数.现从全体学生中随机抽取了部分学生进行调查,并把调查结果绘制成如图所示的条形统计图.已知该校全体学生人数为1200名,由此可以估计选修C课程的学生有 _________ 人.
13.已知在一个样本中,50个数据分别落在5个组内,第一,二,三,四,五组数据的个数分别是2,8,15,20,5,则第四组频数为 _________ .
14.在全国初中数学竞赛中,都匀市有40名同学进入复赛,把他们的成绩分为六组,第一组一第四组的人数分别为10,5,7,6,第五组的频率是0.2,则第六组的频率是 _________ .
15.某记者抽样调查了某校一些学生假期用于读书的时间(单位:
分钟)后,绘制了频数分布直方图,从左到右的前5个长方形相对应的频率之和为0.9,最后一组的频数是15,则此次抽样调查的人数为 _________ 人.(注:
横轴上每组数据包含最小值不包含最大值)
三.解答题(共6小题)
16.学校为了了解初三年级学生体育跳绳的训练情况,从初三年级各班随机抽取了50名学生进行了60秒跳绳的测试,并将这50名学生的测试成绩(即60秒跳绳的个数)从低到高分成六段记为第一到六组,最后整理成下面的频数分布直方图:
请根据直方图中样本数据提供的信息解答下列问题.
(1)跳绳次数的中位数落在哪一组?
由样本数据的中位数你能推断出学校初三年级学生关于60秒跳绳成绩的一个什么结论?
(2)若用各组数据的组中值(各小组的两个端点的数的平均数)代表各组的实际数据,求这50名学生的60秒跳绳的平均成绩(结果保留整数);
(3)若从成绩落在第一和第六组的学生中随机抽取2名学生,用列举法求抽取的2名学生恰好在同一组的概率.
17.为创建“国家园林城市”,某校举行了以“爱我黄石”为主题的图片制作比赛,评委会对200名同学的参赛作品打分发现,参赛者的成绩x均满足50≤x<100,并制作了频数分布直方图,如图.
根据以上信息,解答下列问题:
(1)请补全频数分布直方图;
(2)若依据成绩,采取分层抽样的方法,从参赛同学中抽40人参加图片制作比赛总结大会,则从成绩80≤x<90的选手中应抽多少人?
(3)比赛共设一、二、三等奖,若只有25%的参赛同学能拿到一等奖,则一等奖的分数线是多少?
18.学校举办一项小制作评比活动.作品上交时限为3月1日至30日,组委会把同学们交来的作品按时间顺序每5天组成一组,对每一组的作品件数进行统计,绘制成如图所示
的统计图.已知从左到右各矩形的高度比为2:
3:
4:
6:
4:
1.第三组的件数是12.
请你回答:
(1)本次活动共有 _________ 件作品参赛;各组作品件数的众数是 _________ 件;
(2)经评比,第四组和第六组分别有10件和2件作品获奖,那么你认为这两组中哪个组获奖率较高?
为什么?
(3)小制作评比结束后,组委会决定从4件最优秀的作品A、B、C、D中选出两件进行全校展示,请用树状图或列表法求出刚好展示作品B、D的概率.
19.某校八年级一班进行为期5天的图案设计比赛,作品上交时限为周一至周五,班委会将参赛逐天进行统计,并绘制成如图所示的频数直方图.已知从左到右各矩形的高度比为2:
3:
4:
6:
5.且已知周三组的频数是8.
(1)本次比赛共收到 _________ 件作品.
(2)若将各组所占百分比绘制成扇形统计图,那么第五组对应的扇形的圆心角是 _________ 度.
(3)本次活动共评出1个一等奖和2个二等奖,若将这三件作品进行编号并制作成背面完全相同的卡片,并随机抽出两张,请你求出抽到的作品恰好一个一等奖,一个二等奖的概率.
20.为了了解某地初中三年级学生参加消防知识竞赛成绩(均为整数),从中抽取了1%的同学的竞赛成绩,整理后绘制了如下的频数分布直方图,请结合图形解答下列问题:
(1)指出这个问题中的总体;
(2)求竞赛成绩在84.5﹣89.5这一小组的频率;
(3)如果竞赛成绩在90分以上(含90分)的同学可以获得奖励,请估计该地初三年级约有多少人获得奖励.
21.为提高居民的节水意识,向阳小区开展了“建设节水型社区,保障用水安全”为主题的节水宣传活动,小莹同学积极参与小区的宣传活动,并对小区300户家庭用水情况进行了抽样调查,他在300户家庭中,随机调查了50户家庭5月份的用水量情况,结果如图所示.
(1)试估计该小区5月份用水量不高于12t的户数占小区总户数的百分比;
(2)把图中每组用水量的值用该组的中间值(如0~6的中间值为3)来替代,估计该小区5月份的用水量.
统计与概率——数据的分析与处理1
参考答案与试题解析
一.选择题(共8小题)
1.下列调查中,适合用普查方式的是( )
A.调查佛山市市民的吸烟情况
B.调查佛山市电视台某节目的收视率
C.调查佛山市市民家庭日常生活支出情况
D.调查佛山市某校某班学生对“文明佛山”的知晓率
考点:
全面调查与抽样调查.
分析:
由普查得到的调查结果比较准确,但所费人力、物力和时间较多,而抽样调查得到的调查结果比较近似.
解答:
解:
A.调查佛山市市民的吸烟情况,所费人力、物力和时间较多,适合抽样调查,故A选项错误;
B.调查佛山市电视台某节目的收视率,所费人力、物力和时间较多,适合抽样调查,故B选项错误;
C.调查佛山市市民家庭日常生活支出情况,所费人力、物力和时间较多,适合抽样调查,故C选项错误;
D.调查佛山市某校某班学生对“文明佛山”的知晓率,适合用普查方式,故D选项正确.
故选:
D.
点评:
本题考查了抽样调查和全面调查的区别,选择普查还是抽样调查要根据所要考查的对象的特征灵活选用,一般来说,对于具有破坏性的调查、无法进行普查、普查的意义或价值不大,应选择抽样调查,对于精确度要求高的调查,事关重大的调查往往选用普查.
2.今年我市有4万名学生参加中考,为了了解这些考生的数学成绩,从中抽取2000名考生的数学成绩进行统计分析.在这个问题中,下列说法:
①这4万名考生的数学中考成绩的全体是总体
;②每个考生是个体;③2000名考生是总体的一个样本;④样本容量是2000.
其中说法正确的有( )
A.4个B.3个C.2个D.1个
考点:
总体、个体、样本、样本容量.
分析:
总体是指考查的对象的全体,个体是总体中的每一个考查的对象,样本是总体中所抽取的一部分个体,而样本容量则是指样本中个体的数目.我们在区分总体、个体、样本、样本容量,这四个概念时,首先找出考查的对象,从而找出总体、个体.再根据被收集数据的这一部分对象找出样本,最后再根据样本确定出样本容量.
解答:
解:
这4万名考生的数学中考
成绩的全体是总体;
每个考生的数学中考成绩是个体;
2000名考生的中考数学成绩是总体的一个样本,样本容量是2000.
故正确的是①④.
故选:
C.
点评:
本题考查了总体、个体、样本、样本容量的概念,解题要分清具体问题中的总体、个体与样本,关键是明确考查的对象.总体、个体与样本的考查对象是相同的,所不同的是范围的大小.样本容量是样本中包含的个体的数目,不能带单位.
3.每年4月23日是“世界读书日”,为了了解某校八年级500名学生对“世界读书日”的知晓情况,从中随机抽取了50名学生进行调查.在这次调查中,样本是( )
A.500名学生
B.所抽取的50名学生对“世界读书日”的知晓情况
C.50名学生
D.每一名学生对“世界读书日”的知晓情况
考点:
总体、个体、样本、样本容量.
分析:
总体是指考查的对象的全体,个体是总体中的每一个考查的对象,样本是总体中所抽取的一部分个体,据此即可判断.
解答:
解:
样本是所抽取的50名学生对“世界读书日”的知晓情况.
故选:
B.
点评:
本题考查了样本的定义,解题要分清具体问题中的总体、个体与样本,关键是明确考查的对象.总体、个体与样本的考查对象是相同的,所不同的是范围的大小.
4.从总体中抽取一部分数据作为样本去估计总体的某种属性.下面叙述正确的是( )
A.样本容量越大,样本平均数就越大
B.样本容量越大,样本的方差就越大
C.样本容量越大,样本的极差就越大
D.样本容量越大,对总体的估计就越准确
考点:
用样本估计总体.
专题:
常规题型.
分析:
用样本频率估计总体分布的过程中,估计的是否准确与总体的数量无关,只与样本容量在总体中所占的比例有关,对于同一个总体,样本容量越大,估计的越准确.
解答:
解:
∵用
样本频率估计总体分布的过程中,
估计的是否准确与总体的数量无关,
只与样本容量在总体中所占的比例有关,
∴样本容量越大,估计的越准确.
故选:
D.
点评:
此题考查了抽样和样本估计总体的实际应用,注意在一个总体中抽取一定的样本估计总体,估计的是否准确,只与样本在总体中所占的比例有关.
5.青蛙是我们人类的朋友,为了了解某池塘里青蛙的数量,先从池塘里捕捞20只青蛙,作上标记后放回池塘,经过一段时间后,再从池塘中捕捞出40只青蛙,其中有标记的青蛙有4只,请你估计一下这个池塘里有多少只青蛙?
( )
A.100只B.150只C.180只D.200只
考点:
用样本估计总体.
分析:
从池塘中捕捞出40只青蛙,其中有标记的青蛙有4只,即在样本中有标记的所占比例为
,而在整体中有标记的共有20只,根据所占比例即可解答.
解答:
解:
∵从池塘中捕捞出40只青蛙,其中有标记的青蛙有4只,
∴在样本中有标记的所占比例为
,
∴池塘里青蛙的总数为20÷
=200.
故选:
D.
点评:
此题主要考查了用样本去估计总体,统计的思想就是用样本的信息来估计总体的信息.
6.如图是交警在一个路口统计的某个时段来往车辆的车速(单位:
千米/时)情况.则这些车的车速的众数、中位数分别是( )
A.8,6B.8,5C.52,53D.52,52
考点:
频数(率)分布直方图;中位数;众数.
专题:
计算题.
分析:
找出出现次数最多的速度即为众数,将车速按照从小到大顺序排列,求出中位数即可.
解答:
解:
根据题意得:
这些车的车速的众数52千米/时,
车速分别为50,50,51,51,51,51,51,52,52,52,52,52
,52,52,52,53,53,53,53,53,53,54,54,54,54,55,55,
中间的为52,即中位数为52千米/时,
则这些车的车速的众数、中位数分别是52,52.
故选:
D.
点评:
此题考查了频数(率)分布直方图,中位数,以及众数,弄清题意是解本题的关键.
7.如图分别是某班全体学生上学时乘车、步行、骑车人数的分布直方图和扇形统计图(两图都不完整),下列结论错误的是( )
A.该班总人数为50人B.步行人数为30人
C.乘车人数是骑车人数的2.5倍D.骑车人数占20%
考点:
频数(率)分布直方图;扇形统计图.
分析:
根据乘车人数是25人,而乘车人数所占的比例是50%,即可求得总人数,然后根据百分比的含义即可求得步行的人数,以及骑车人数所占的比例.
解答:
解:
A、总人数是:
25÷50%=50(人),故A正确;
B、步行的人数是:
50×30%=15(人),故B错误;
C、骑车人数所占的比例是:
1﹣50%﹣30%=20%,故D正确;
D、乘车人数是骑车人数倍数是:
50%÷20%=2.5,故C正确.
由于该题选择错误的,故选:
B.
点评:
本题考查读频数分布直方图的能力和利用统计图获取信息的能力;利用统计图获取信息时,必须认真观察、分析、研究统计图,才能作出正确的判断和解决问题.
8.为积极响应南充市创建“全国卫生城市”的号召,某校1500名学生参加了卫生知识竞赛,成绩记为A、B、C、D四等.从中随机抽取了部分学生成绩进行统计,绘制成如图两幅不完整
的统计图表,根据图表信息,以下说法不正确的是( )
A.样本容量是200
B.D等所在扇形的圆心角为15°
C.样本中C等所占百分比是10%
D.估计全校学生成绩为A等大约有900人
考点:
条形统计图;用样本估计总体;扇形统计图.
专题:
图表型.
分析:
根据条形统计图和扇形统计图提供的数据分别列式计算,再对每一项进行分析即可.
解答:
解:
A、
=200(名),则样本容量是200,故本选项正确;
B、成绩为A的人数是:
200×60%=120(人),
成绩为D的人数是200﹣120﹣50
﹣20=10(人),
D等所在扇形的圆心角为:
360°×
=18°,
故本选项错误;
C、样本中C等所占百分比是1﹣60%﹣25%﹣
=10
%,
故本选项正确;
D、全校学生成绩为A等大约有1500×60%=900人,
故本选项正确;
故选:
B.
点评:
本题考查的是条形统计图和扇形统计图的综合运用,读懂统计图,从不同的统计图中得到必要的信息是解决问题的关键.条形统计图能清楚地表示出每个项目的数据;扇形统计图直接反映部分占总体的百分比大小.
二.填空题(共7小题)
9.在开展“国学诵读”活动中,某校为了解全校1300名学生课外阅读的情况,随机调查了50名学生一周的课外阅读时间,并绘制成如图所示的条形统计图.根据图中数据,估计该校1300名学生一周的课外阅读时间不少于7小时的人数是 520 .
考点:
用样本估计总体;条形统计图.
专题:
图表型.
分析:
用所有学生数乘以课外阅读时间不少于7小时的人数所占的百分比即可.
解答:
解:
该校1300名学生一周的课外阅读时间不少于7小时的人数是1300×
=520人,
故答案为:
520.
点评:
本题考查了用样本估计总体的知识,解题的关键是求得样本中不少于7小时的人数所占的百分比.
10.如图,某校根据学生上学方式的一次抽样调查结果,绘制出一个未完成的扇形统计图,若该校共有学生700人,则据此估计步行的有 280 人.
考点:
用样本估计总体;扇形统计图.
专题:
图表型.
分析:
先求出步行的学生所占的百分比,再用学生总数乘以步行学生所占的百分比即可估计全校步行上学的学生人数.
解答:
解:
∵骑车的学生所占的百分比是
×100%=35%,
∴步行的学生所占的百分比是1﹣10%﹣15%﹣35%=40%,
∴若该校共有学生700人,则据此估计步行的有700×40%=280(人).
故答案为:
280.
点评:
本题考查了扇形统计图及用样本估计总数的知识,解题的关键是从统计图中得出步行上学学生所占的百分比.
11.某校九年级有560名学生参加了市教育局举行的读书活动,现随机调查了70名学生读书的数量,根据所得数据绘制了如图的条形统计图,请估计该校九年级学生在此次读书活动中共读书 2040 本.
考点:
用样本估计总体;条形统计图.
专题:
图表型.
分析:
利用条形统计图得出70名同学一共借书的本数,进而得出该校九年级学生在此次读书活动中共读书本数.
解答:
解:
由题意得出:
70名同学一共借书:
2×5+30×3+20×4+5×15=255(本),
故该校九年级学生在此次读书活动中共读书:
×255=2040(本).
故答案为:
2040.
点评:
此题主要考查了用样本估计总体以及条形统计图等知识,得出70名同学一共借书的本数是解题关键.
12.某学校计划开设A、B、C、D四门校本课程供全体学生选修,规定每人必须并且只能选修其中一门,为了了解各部门课程的选修人数.现从全体学生中随机抽取了部分学生进行调查,并把调查结果绘制成如图所示的条形统计图.已知该校全体学生人数为1200名,由此可以估计选修C课程的学生有 240 人.
考点:
用样本估计总体;条形统计图.
专题:
图表型.
分析:
根据样本的数据,可得样本C占样本的比例,根据样本的比例,可C占总体的比例,根据总人数乘以C占得比例,可得答案.
解答:
解:
C占样本的比例
,
C占总体的比例是
,
选修C课程的学生有1200×
=240(人),
故答案为:
240.
点评:
本题考查了用样本估计总体,先求出样本所占的比例,估计总体中所占的比例.
13.已知在一个样本中,50个数据分别落在5个组内,第一,二,三,四,五组数据的个数分别是2,8,15,20,5,则第四组频数为 20 .
考点:
频数与频率.
分析:
根据各小组频数之和等于数据总和,进行计算.
解答:
解:
根据题意,得
第四组频数为第4组数据个数,故第四组频数为20.
故答案为:
20.
点评:
本题是对频率、频数灵活运用的综合考查.
注意:
各小组频数之和等于数据总和,各小组频率之和等于1.
14.在全国初中数学竞赛中,都匀市有40名同学进入复赛,把他们的成绩分为六组,第一组一第四组的人数分别为10,5,7,6,第五组的频率是0.2,则第六组的频率是 0.1 .
考点:
频数与频率.
分析:
先用数据总数乘第五组的频率得出第五组的频数,再求出第六组的频数,然后根据频率=频数÷数据总数即可求解.
解答:
解:
∵都匀市有40名同学进入复赛,把他们的成绩分为六组,第一组一第四组的人数分别为10,5,7,6,第五组的频率是0.2,
∴第五组的频数为40×0.2=8,第六组的频数为40﹣(10+5+7+6+8)=4,
∴第六组的频率是4÷40=0.1.
故答案为:
0.1.
点评:
本题考查了频数与频率,用到的知识点:
频数=数据总数×频率,频率=频数÷数据总数,各组频数之和等于数据总数.
15.某记者抽样调查了某校一些学生假期用于读书的时间(单位:
分钟)后,绘制了频数分布直方图,从左到右的前5个长方形相对应的频率之和为0.9,最后一组的频数是15,则此次抽样调查的人数为 150 人.(注:
横轴上每组数据包含最小值不包含最大值)
考点:
频数(率)分布直方图.
专题:
常规题型.
分析:
根据直方图中各组的频率之和等于1,结合题意可得最后一组的频率,再由频率的计算公式可得总人数,即得答案.
解答:
解:
由题意可知:
最后一组的频率=1﹣0.9=0.1,
则由频率=频数÷总人数可得:
总人数=15÷0.1=150人;
故答案为:
150.
点评:
本题考查了频数分布直方图的知识,解题的关键是牢记公式:
频率=频数÷总人数.
三.解答题(共6小题)
16.学校为了了解初三年级学生体育跳绳的训练情况,从初三年级各班随机抽取了50名学生进行了60秒跳绳的测试,并将这50名学生的测试成绩(即60秒跳绳的个数)从低到高分成六段记为第一到六组,最后整理成下面的频数分布直方图:
请根据直方图中样本数据提供的信息解答下列问题.
(1)跳绳次数的中位数落在哪一组?
由样本数据的中位数你能推断出学校初三年级学生关于60秒跳绳成绩的一个什么结论?
(2)若用各组数据的组中值(各小组的两个端点的数的平均数)代表各组的实际数据,求这50名学生的60秒跳绳的平均成绩(结果保留整数);
(3)若从成绩落在第一和第六组的学生中随机抽取2名学生,用列举法求抽取的2名学生恰好在同一组的概率.
考点:
频数(率)分布直方图;中位数;列表法与树状图法.
专题:
图表型.
分析:
(1)根据中位数的定义先把这组数据从小到大排列,找出中间两个数的平均数,再根据中位数落在第四组估计出初三学生60秒跳绳再120个以上的人数达到一半以上;
(2)根据平均数的计算公式进行计算即可;
(3)先把第一组的两名学生用A、B表示,第六组的三名学生用1,2,3表示,得出所有出现的情况,再根据概率公式进行计算即可.
解答:
解:
(1)∵共有50个数,中位数是第25、26个数的平均数,
∴跳绳次数的中位数落在第四组;
∴可以估计初三学生60秒跳绳再120个以上的人数达到一半以上;
(2)根据题意得:
(2×70+10×90+12×110+13×130+10×150+3×170)÷
50≈121(个),
答:
这50名学生的60秒跳绳的平均成绩是121个;
(3)记第一组的两名学生为A、B,第六组的三名学生为1,2,3,
则从这5名学生中抽取两名学生有以下10种情况:
AB,A1,A