数据分析.docx
《数据分析.docx》由会员分享,可在线阅读,更多相关《数据分析.docx(16页珍藏版)》请在冰豆网上搜索。
数据分析
数据分析
(二)
温故知新
一.选择题(共4小题)
1.一组数据2,3,5,7,8的平均数是( )
A.2B.3C.4D.5
2.某校调查了20名同学某一周玩手机游戏的次数,调查结果如下表所示,那么这20名同学玩手机游戏次数的平均数为( )
次数
2
4
5
8
人数
2
2
10
6
A.5B.5.5C.6D.6.5
3.一组数据:
6,3,4,5,7的平均数和中位数分别是( )
A.5,5B.5,6C.6,5D.6,6
4.在学校举行“阳光少年,励志青春”的演讲比赛中,五位评委给选手小明的评分分别为:
90,85,90,80,95,则这组数据的众数是( )
A.95B.90C.85D.80
二.解答题(共1小题)
5.某工厂甲、乙两个部门各有员工400人,为了解这两个部门员工的生产技能情况,进行了抽样调查,过程如下,请补充完整.
收集数据
从甲、乙两个部门各随机抽取20名员工,进行了生产技能测试,测试成绩(百分制)如下:
甲
7886748175768770759075798170748086698377
乙
9373888172819483778380817081737882807040
整理、描述数据
按如下分数段整理、描述这两组样本数据:
成绩x人数部门
40≤x≤49
50≤x≤59
60≤x≤69
70≤x≤79
80≤x≤89
90≤x≤100
甲
0
0
1
11
7
1
乙
(说明:
成绩80分及以上为生产技能优秀,70﹣﹣79分为生产技能良好,60﹣﹣69分为生产技能合格,60分以下为生产技能不合格)
分析数据
两组样本数据的平均数、中位数、众数如下表所示:
部门
平均数
中位数
众数
甲
78.3
77.5
75
乙
78
80.5
81
得出结论:
a.估计乙部门生产技能优秀的员工人数为 ;b.可以推断出 部门员工的生产技能水平较高,理由为 .(至少从两个不同的角度说明推断的合理性)
课前热身
.选择题(共4小题)
1.对一组数据:
﹣2,1,2,1,下列说法不正确的是( )
A.平均数是1B.众数是1C.中位数是1D.极差是4
2.关于一组数据:
1,5,6,3,5,下列说法错误的是( )
A.平均数是4B.众数是5C.中位数是6D.方差是3.2
3.小广、小娇分别统计了自己近5次数学测试成绩,下列统计量中能用来比较两人成绩稳定性的是( )
A.方差B.平均数C.众数D.中位数
4.小明准备参加校运会的跳远比赛,下面是他近期六次跳远的成绩(单位:
m):
3.6,3.8,4.2,4.0,3.8,4.0.那么,下列结论正确的是( )
A.众数是3.9mB.中位数是3.8mC.平均数是4.0mD.极差是0.6m
二.解答题(共2小题)
5.若数据2,a,3,4的极差为5,求a的值及这组数据的平均数.
6.市射击队为从甲、乙两名运动员中选拔一人参加省比赛,对他们进行了六次测试,测试成绩如表:
选手
选拔成绩/环
中位数
平均数
甲
10
9
8
8
10
9
乙
10
10
8
10
7
9
(1)把表中所空各项数据填写完整;
(2)分别计算甲、乙六次测试成绩的方差;
(3)根据
(1)、
(2)计算的结果,你认为推荐谁参加省比赛更合适,请说明理由.
遗漏分析
1.方差和极差混淆;
2.对于综合应用思路混乱
知识精讲
知识点1.极差
数据中最大值和最小值的差称之为极差,即极差=最大值-最小值
例1.在一家三口人中,每两个人的平均年龄加上余下一人的年龄分别得到47、61、60,那么这三个人中最大年龄与最小年龄的差是( )
A.28B.27C.26D.25
变式1..在10,20,40,30,80,90,50,40,40,50这10个数据中,算出这组数据的极差是( )
A.40B.70C.80D.90
知识点2:
方差
设有n个数据
,各数据与它们的平均数
的差的平方的平均数叫做这组数据的方差,通常以
表示,即
=
.
方差的计算方法有如下三种:
(1)定义法:
利用方差定义公式计算.(计算方法:
先平均,再求差,平方后,再平均)
(2)原式数据计算法:
当一组数据中的数据较小时,可直接利用原始数据进行计算:
.
(3)新数据计算法:
当一组数据中的数据较大且比较集中时,可以依照简化平均数的计算方法,将每个数据减去与它们的平均数接近的常数a,得到一组新数据:
,那么
例2有一组数据如下:
3,a,4,6,7,它们的平均数是5,那么这组数据的方差是( )
A.10B.
C.2D.
变式2在珠穆朗玛峰周围2千米的范围内,还有较著名的洛子峰(海拔8516米)、卓穷峰(海拔7589米),马卡鲁峰(海拔8463米),章子峰(海拔7543米),努子峰(海拔7855米),和普莫里峰(海拔7145米)六座山峰,则这六座山峰海拔高度的极差为 米.
例3甲、乙、丙三个旅游团的游客人数都相等,且每个团游客的平均年龄都是35岁,这三个团游客年龄的方差分别是S甲2=1.4,S乙2=18.8,S丙2=25,导游小方最喜欢带游客年龄相近的团队,若在这三个团中选择一个,则他应选( )
A.甲队B.乙队C.丙队D.哪一个都可以
变式3甲、乙、丙、丁四名射击队员考核赛的平均成绩(环)及方差统计如表,现要根据这些数据,从中选出一人参加比赛,如果你是教练员,你的选择是( )
队员
平均成绩
方差
甲
9.7
2.12
乙
9.6
0.56
丙
9.7
0.56
丁
9.6
1.34
A.甲B.乙C.丙D.丁
知识点3.极差和方差的区别
区别:
极差:
简单的一种度量数据波动的量,但只能反映数据的波动范围,不能衡量每个数据的变化情况,而且受极端值的影响较大。
方差:
用来衡量一批数据的波动的大小,(即偏离平均数的大小).
方差越大,数据波动越大,越不稳定;反之.
例4.刻画一组数据波动大小的统计量是( )
A.平均数B.方差C.众数D.中位数
变式4.小广、小娇分别统计了自己近5次数学测试成绩,下列统计量中能用来比较两人成绩稳定性的是( )
A.方差B.平均数C.众数D.中位数
知识点4:
数据分析的综合应用:
利用图表给出的信息来计算图表缺失部分信息和来计算总体的信息。
①主要是知道知道某一数量和占样本量的百分比,计算样本总体和剩余的数量或百分比;
②根据样本计算总体;
例5.在一次中学生田径运动会上,根据参加男子跳高初赛的运动员的成绩(单位:
m),绘制出如下的统计图①和图②,请根据相关信息,解答下列问题:
(Ⅰ)图1中a的值为 ;
(Ⅱ)求统计的这组初赛成绩数据的平均数、众数和中位数;
(Ⅲ)根据这组初赛成绩,由高到低确定9人进入复赛,请直接写出初赛成绩为1.65m的运动员能否进入复赛.
变式5.某校为了进一步改进本校七年级数学教学,提高学生学习数学的兴趣,校教务处在七年级所有班级中,每班随机抽取了6名学生,并对他们的数学学习情况进行了问卷调查.我们从所调查的题目中,特别把学生对数学学习喜欢程度的回答(喜欢程度分为:
“A﹣非常喜欢”、“B﹣比较喜欢”、“C﹣不太喜欢”、“D﹣很不喜欢”,针对这个题目,问卷时要求每位被调查的学生必须从中选一项且只能选一项)结果进行了统计,现将统计结果绘制成如下两幅不完整的统计图.
请你根据以上提供的信息,解答下列问题:
(1)补全上面的条形统计图和扇形统计图;
(2)所抽取学生对数学学习喜欢程度的众数是 ;
(3)若该校七年级共有960名学生,请你估算该年级学生中对数学学习“不太喜欢”的有多少人?
巩固练习
一.选择题(共6小题)
1.2012年4月份,某市市区一周空气质量报告中某项污染指数的数据是:
31,35,31,33,30,33,31,则下列表述错误的是
( )
A.众数是31B.中位数是30C.平均数是32D.极差是5
2.在九年级体育中考中,某班参加仰卧起坐测试的一组女生(每组8人)测试成绩如下(单位:
次/分):
46,44,45,42,48,46,47,45.则这组数据的极差为( )
A.2B.4C.6D.8
3.对于一组统计数据:
3,3,6,3,5,下列说法中错误的是( )
A.中位数是6B.众数是3C.平均数是4D.方差是1.6
4.甲、乙两人5次射击命中的环数如下:
甲
7
9
8
6
10
乙
7
8
9
8
8
则以下判断中正确的是( )
A.
甲=
乙,S甲2=S乙2.B.
甲=
乙,S甲2>S乙2.
C.
甲=
乙,S甲2<S乙2.D.
甲<
乙,S甲2<S乙2.
5.关于一组数据的平均数、中位数、众数,下列说法中正确的是( )
A.平均数一定是这组数中的某个数
B.中位数一定是这组数中的某个数
C.众数一定是这组数中的某个数
D.以上说法都不对
6.刻画一组数据波动大小的统计量是( )
A.平均数B.方差C.众数D.中位数
二.填空题(共3小题)
7.样本﹣1、0、1、2、3的极差是 .
8.数据1,2,3,4,5的方差为 .
9.学校要从小明等13名同学出选出6名学生参加数学竞赛.经过选拔赛后,小明想提前知道自己能否被选上,他除了要知道自己的成绩以外,还要知道这13名同学成绩的 .
三.解答题(共2小题)
10.某校开展一项以班级为单位的投三分球比赛.规则如下:
①在三分投篮线外,将球投向筐中,只要投进一次,该局便结束;②若一次未进可再投第二次,以此类推,直至投进;③若投第n次时才投中,则得分为n;④每班安排5位选手,5人得分之和为该班最终积分,积分最小的班级获胜.为确定参加比赛的人选,初三
(1)班组织本班体育爱好者进行了预选赛,有4名同学成绩非常突出,已被确定为参赛选手,班主任通过统计分析,准备从双胞胎兄弟姚亦、姚新两人中挑选一人为最后一位选手,他俩的比赛得分如下:
姚亦:
3,1,5,4,3,2,3,6,8,5;
姚新:
1,4,3,3,1,3,2,8,3,12.
(1)姚亦、姚新兄弟俩的平均得分分别是多少?
(2)姚亦得分的中位数、众数、极差分别是多少?
(3)利用你所学习到的统计知识,请你帮助班主任确定最后一位选手,并说明理由.
11.甲、乙两人分别在六次射击中的成绩如下表:
(单位:
环)
第1次
第2次
第3次
第4次
第5次
第6次
甲
6
7
7
8
6
8
乙
5
9
6
8
5
9
分别算出两人射击的平均数和方差.这六次射击中成绩发挥比较稳定的是谁?
课堂小结
强化提升
一.选择题(共5小题)
1.麻城市思源实验学校篮球队12名队员的年龄如下表:
年龄:
(岁)
13
14
15
16
人数
2
5
4
1
关于这12名队员的年龄,下列说法错误的是( )
A.众数是14B.极差是3C.中位数是14D.平均数是14.8
2.合作交流是学习数学的重要方式之一,某校九年级每班的合作学习小组的个数分别是:
8,7,7,8,9,7,则由这组数据得到的结论中错误的是( )
A.平均数是7B.中位数是7.5C.众数是7D.极差是2
3.已知一组数据a,b,c的平均数为5,方差为4,那么数据a﹣2,b﹣2,c﹣2的平均数和方差分别是( )
A.3,2B.3,4C.5,2D.5,4
4.某科普小组有5名成员,身高分别为(单位:
cm):
160,165,170,163,167.增加1名身高为165cm的成员后,现科普小组成员的身高与原来相比,下列说法正确的是( )
A.平均数不变,方差不变B.平均数不变,方差变大
C.平均数不变,方差变小D.平均数变小,方差不变
5.在我市举办的中学生“争做文明盘锦人”演讲比赛中,有15名学生进入决赛,他们决赛的成绩各不相同,小明想知道自己能否进入前8名,不仅要了解自己的成绩,还要了解这15名学生成绩的( )
A.众数B.方差C.平均数D.中位数
二.填空题(共3小题)
6.若一组数据1、﹣2、x、0的极差是6,则x= .
7.甲、乙两名同学参加“古诗词大赛”活动,五次比赛成绩的平均分都是85分,如果甲比赛成绩的方差为S甲2=16.7,乙比赛成绩的方差为S乙2=28.3,那么成绩比较稳定的是 (填“甲”或“乙”)
8.在某校举行的“人人崇尚美,个个奉献爱”的演讲比赛中,有9名学生参加决赛,他们决赛的最终成绩各不相同,其中一位同学想知道自己是否进入前5名,不仅要了解自己的成绩,还要了解这8名学生成绩的 (填“平均数”“中位数”或“众数”)
三.解答题(共3小题)
9.有一组数据2,3,4,5,x
(1)当这组数据的极差为10时,写出x的值?
(2)当这组数据的平均数等于中位数时,求出x的值?
10.某校要从八年级甲、乙两个班中各选取10名女同学组成礼仪队,选取的两个班女生的身高如下(单位:
cm):
甲班:
168167170165168166171168167170
乙班:
165167169170165168170171168167
(1)补充完成下面的统计分析表:
班级
平均数
方差
中位数
甲班
168
168
乙班
168
3.8
(2)根据如表,请选择一个合适的统计量作为选择标准,说明哪一个班能被选取.
11.体育课上,老师为了解女学生定点投篮的情况,随机抽取8名女生进行每人4次定点投篮的测试,进球数的统计如图所示.
(1)求女生进球数的平均数、中位数;
(2)投球4次,进球3个以上(含3个)为优秀,全校有女生1200人,估计为“优秀”等级的女生约为多少人?
∙(2016•攀枝花)如图是化学园地中一张表示物质间反应关系的卡片图(“--”表示相连的两种物质能够在溶液体系中发生化学反应),其中甲、乙、丙三处的卡片尚未粘贴.下列说法不正确的是( )
∙(2016•乐山)甲、乙、丙和X、Y、Z都是初中化学中常见的物质,甲、乙、丙都是氧化物,且常温下甲固体,乙是气体,丙是液体.在一定条件下,甲、乙、丙之间存在如图所示的转化关系(反应条件和部分生成物已略去).下列判断正确的是( )
∙(2016•凉山州)下列物质的区别,您认为不合理的是( )
∙(2016•昆明)某白色粉末可能含有碳酸钠、硫酸钠、硫酸钾、氯化钾、氢氧化钡中的一种或几种,为了探究其成分,小王同学按照如图所示流程进行了实验:
关于该实验有以下说法:
①步骤Ⅱ中沉淀全部溶解.则原白色粉末一定有氢氧化钡、碳酸钠,可能有氯化钾②步骤Ⅱ中沉淀部分溶解,则原白色粉末一定有氢氧化钡、碳酸钠、硫酸钾③步骤Ⅱ中沉淀不溶解.则原白色粉末一定有氢氧化钡,一定没有碳酸钠④步骤Ⅱ中沉淀部分溶解,则原白色粉末的组成可能有3种情况以上说法中正确的个数是( )
课后作业
一.选择题(共4小题)
1.在一家三口人中,每两个人的平均年龄加上余下一人的年龄分别得到47、61、60,那么这三个人中最大年龄与最小年龄的差是( )
A.28B.27C.26D.25
2.在10,20,40,30,80,90,50,40,40,50这10个数据中,算出这组数据的极差是( )
A.40B.70C.80D.90
3.已知一组数据的方差为
,数据为:
﹣1,0,3,5,x,那么x等于( )
A.﹣2或5.5B.2或﹣5.5C.4或11D.﹣4或﹣11
4.已知数据a1,a2,a3,a4,a5是互不相等的正整数,且平均数和中位数都是3,则这组数据的方差为( )
A.5B.4C.3D.2
二.填空题(共4小题)
5.某日天气预报说今天最高气温为8℃,气温的极差为10℃,则该日最低气温为 ℃.
6.设x1,x2,…,xn平均数为
,方差为s2.若s2=0,则x1,x2,…,xn应满足的条件是 .
7.在演唱比赛中,8位评委给一名歌手的演唱打分如下:
9.3,9.5,9.9,9.4,9.3,8.9,9.2,9.6,若去掉一个最高分和一个最低分后的平均分为得分,则这名歌手最后得分约为 分.(保留2个有效数字)
8.10位学生的鞋号从小到大依次是20,20,21,21,22,22,22,22,23,23,这组数据的平均数、中位数和众数中,鞋厂最感兴趣的是 ,最不感兴趣的是 .
三.解答题(共3小题)
9.某单位对全体职工的年龄进行了调查统计,结果如下(单位:
岁):
将数据适当分组,列出频数分布表,绘制相应的频数分布直方图.
解:
最大值是 ,最小值是 ,极差是 岁;取组距为10岁,可以分成 组.
10.如图,是根据某校七、八、九年级学生“献爱心”自愿捐款活动学生捐款情况制成的条形图和七、八、九年级学生人数扇形分布图.
(1)该校七、八、九年级平均每人捐款多少元?
(2)若该校共有1450名学生,试问九年级学生共捐款多少元?
11.为了考察某班普通话测试情况,从中抽查了10人的成绩如下(单位:
分):
87,90,98,74,89,90,85,80,90,93.
(1)这个问题中,总体、个体、样本各是什么?
(2)这个问题中,样本平均数、方差、标准差各是多少并估计总体平均数、方差、标准差?
(平均数精确到1分,标准差保留三个有效数字).