数据的分析.docx
《数据的分析.docx》由会员分享,可在线阅读,更多相关《数据的分析.docx(23页珍藏版)》请在冰豆网上搜索。
数据的分析
数据的分析
第一部分知识梳理
一、数据的代表
1.平均数的概念
(1)平均数:
一般地,如果有n个数
那么,
叫做这n个数的平均数。
(2)加权平均数:
如果n个数中,
出现
次,
出现
次,…,
出现
次(这里
),那么,根据平均数的定义,这n个数的平均数可以表示为
,这样求得的平均数
叫做加权平均数,其中
叫做权。
2.众数:
在一组数据中,出现次数最多的数据叫做这组数据的众数。
3.中位数:
将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数。
二、数据的波动
1.方差的概念:
在一组数据
中,各数据与它们的平均数
的差的平方的平均数,叫做这组数据的方差。
通常用“
”表示,即
2.标准差:
方差的算数平方根叫做这组数据的标准差,用“s”表示,即
第二部分例题与解题思路方法归纳
类型一平均数
【例题1】(2010•宁德)下表是中国2010年上海世博会官方网站公布的5月某一周入园参观人数,则这一周入园参观人数的平均数是 万.
〖选题意图〗本题考查的是样本平均数的求法,熟记公式是解决本题的关键.
〖解题思路〗只要运用平均数公式:
,即可求出.
〖参考答案〗解:
平均数=(36.12+31.14+31.4+34.42+35.26+37.7+38.12)÷7≈34.88(万),
所以这一周入园参观人数的平均数是34.88万.
故填34.88.
【课堂训练题】
1.某酒店共有6名员工,所有员工的工资如下表所示:
(1)酒店所有员工的平均月工资是多少元?
(2)平均月工资能准确反映该酒店员工工资的一般水平吗?
若能,请说明理由.若不能,如何才能较准确地反映该酒店员工工资的一般水平?
谈谈你的看法.
〖参考答案〗解:
(1)平均月工资=(4000+600+900+500+500+400)÷6=1150(元),
(2)∵能达到这个工资水平的只有2人,
∴平均月工资不能准确反映该酒店员工工资的一般水平,这组数据的众数是500元,才能较准确地反映该酒店员工工资的一般水平,原因是它符合多数人的工资水平.
2.某企业招工广告中称,本企业所有员工的平均工资为2000元/月,如果是事实,你愿意受聘于该企业吗?
〖参考答案〗解:
不一定.
因为可能比2000元高的员工的工资的平均工资比全部的平均工资高的多,
比2000元低的员工的工资的平均数比全部的平均数低得多,
那么平均工资为2000元,这个数不能说明大多数员工的工资,
因此不一定去;
如果2000元是中位数,还是能够去的.
【例题2】在“情系玉树献爱心”捐款活动中,某校九
(1)班同学人人拿出自己的零花钱,现将同学们的捐款数整理成统计表,则该班同学平均每人捐款元 .
捐款数(元)
5
10
20
50
人数
4
15
6
5
〖选题意图〗本题考查的是加权平均数的求法.熟记公式是解决本题的关键.
〖解题思路〗平均数是指在一组数据中所有数据之和再除以数据的个数.
〖参考答案〗解:
(5×4+10×15+20×6+50×5)÷30=18元,
∴该班同学平均每人捐款18元.故填18.
【课堂训练题】
1.某生数学科课堂表现为90分、平时作业为92分、期末考试为85分,若这三项成绩分别按30%、30%、40%的比例计入总评成绩,则该生数学科总评成绩是 分.
〖参考答案〗解:
=90×30%+92×30%+85×40%=27+27.6+34=88.6.
2.为了调查某一路口某时段的汽车流量,记录了15天同一时段通过该路口的汽车辆数,其中有2天是142辆,2天是145辆,6天是156辆,5天是157辆,那么这15天通过该路口汽车平均辆数为( )
A.146B.150C.153D.1600
〖参考答案〗解:
依题意有:
(142×2+145×2+6×156+5×157)÷15=153.故选C.
类型二中位数、众数
【例题3】(2010•鸡西)一组数据:
3,4,9,x,它的平均数比它唯一的众数大1,则x= .
〖选题意图〗本题考查了确定一组数据众数与平均数的能力.正确运用分类讨论的思想是解答本题的关键.众数是一组数据中出现次数最多的数据,注意众数可以不止一个.
〖解题思路〗众数可能是3,也可能是4或9,因此应分众数是3或4或9三种情况进行讨论.
〖参考答案〗解:
当众数为3时,(3+4+9+x)÷4=4,则x=0;
当众数为4时,(3+4+9+x)÷4=5,则x=4;
当众数为9时,(3+4+9+x)÷4=10,则x=24.
∴x=0,4或24.
当x=0,24时,没有众数
∴x=4
故答案为4.
【课堂训练题】
1.100名学生进行20秒钟跳绳测试,测试成绩统计如下表:
跳绳个数x
20<x≤30
30<x≤40
40<x≤50
50<x≤60
60<x≤70
x>70
人数
5
2
13
31
23
26
则这次测试成绩的中位数m满足( )
A.40<m≤50B.50<m≤60C.60<m≤70D.m>70
〖参考答案〗解:
∵一共有100名学生参加测试,
∴中位数应该是第50名和第51名成绩的平均数,
∵第50名和第51名的成绩均在50<x≤60,
∴这次测试成绩的中位数m满足50<x≤60,
故选B.
2.在“庆祝建党90周年的红歌传唱活动”比寒中,七位评委给某参赛队打的分数为:
92、86、88、87、92、94、86,则去掉一个最高分和一个最低分后,所剩五个分数的平均数和中位数是( )
A.89,92B.87,88C.89,88D.88,92
〖参考答案〗解:
根据去掉一个最高分和一个最低分后,所剩五个分数的平均数为:
平均数:
(92+86+88+87+92)÷5=89,故平均数是89;
将数据按从小到大的顺序排列得:
86、87、88、92、92.
最中间的年龄是88,
故中位数是88.故选:
C.
类型三极差、方差和标准差
【例题4】一组数据3,x,0,﹣1,﹣3的平均数是1,则这组数据的极差为 .
〖选题意图〗本题考查了极差的定义,求极差的方法是用一组数据中的最大值减去最小值.
〖解题思路〗根据平均数的定义即可求得x的值,进而得到这组数据的极差.
〖参考答案〗解:
根据题意得:
3+x+0﹣1﹣3=1×5,解得x=6.
则这组数的极差是6﹣(﹣3)=9.
【课堂训练题】
1.“恒盛”超市购进一批大米,大米的标准包装为每袋30kg,售货员任选6袋进行了称重检验,超过标准重量的记作“+”,不足标准重量的记作“﹣”,他记录的结果是+0.5,﹣0.5,0,﹣0.5,﹣0.5,+1,那么这6袋大米重量的平均数和极差分别是( )
A.0,1.5B.29.5,1C.30,1.5D.30.5,0
〖参考答案〗解:
平均数:
30+(0.5﹣0.5+0﹣0.5﹣0.5+1)÷6=30(kg),
极差:
(30+1)﹣(30﹣0.5)=1.5(kg),故选:
C.
2.一组数据为1,5,3,4,5,6,这组数据的极差、众数、中位数分别为( )
A.5,4,5B.5,5,4.5C.5,5,4D.5,3,2
〖参考答案〗解:
先对这组数据按从小到大的顺序重新排序:
1,3,4,5,5,6.
位于最中间的数是4和5,
∴这组数的中位数是4.5.
这组数出现次数最多的是5,
∴这组数的众数是5
极差为:
6﹣1=5.
故选B.
【例题5】博才中学要从甲、乙两名同学中选拔一名同学代表学校参加“华罗庚金杯”数学竞赛活动.这两位活动同学最近四次的数学测验成绩如下表:
(单位:
分)
第一次
第二次
第三次
第四次
甲
75
70
85
90
乙
85
82
75
78
(1)根据表中数据,分别求出甲、乙两名同学这四次数学测验成绩的平均分.
(2)经计算,甲、乙两位同学这四次数学测验成绩的方差分别为S甲2=62.5,S乙2=14.5,你认为哪位同学的成绩较稳定?
请说明理由.
〖选题意图〗本题考查了方差、平均数,方差的意义:
方差是用来衡量一组数据波动大小的量,方差越大,表明这组数据偏离平均数越大,即波动越大,数据越不稳定;反之,方差越小,表明这组数据分布比较集中,各数据偏离平均数越小,即波动越小,数据越稳定.
〖解题思路〗
(1)由平均数的公式计算即可;
(2)方差越小,成绩越稳定,反之,方差越大,成绩越不稳定.
〖参考答案〗解:
(1)
甲=
(75+70+85+90)=80,
乙=
(75+78+85+82)=80,
(2)∵S甲2=62.5,S乙2=14.5,
∴S甲2>S乙2,
∴乙的成绩稳定,因为甲的方差大于乙的方差.
【课堂训练题】
1.王大伯几年前承包了甲、乙两片荒山,各栽100棵杨梅树,成活98%.现已挂果,经济效益初步显现,为了分析收成情况,他分别从两山上随意各采摘了4棵树上的杨梅,每棵的产量如折线统计图所示.
(1)分别计算甲、乙两山样本的平均数,并估算出甲、乙两山杨梅的产量总和;
(2)试通过计算说明,哪个山上的杨梅产量较稳定?
〖参考答案〗解:
(1)
(千克),
(千克),
总产量为40×100×98%×2=7840(千克);
(2)
(千克2),
(千克2),
∴S2甲>S2乙.
答:
乙山上的杨梅产量较稳定.
2.一次期中考试中,A、B、C、D、E五位同学的数学、英语成绩等有关信息如下表所示:
(单位:
分)
(1)求这五位同学在本次考试中数学成绩的平均分和英语成绩的标准差;
(2)为了比较不同学科考试成绩的好与差,采用标准分是一个合理的选择,标准分的计算公式是:
标准分=(个人成绩一平均成绩)÷成绩标准差.
从标准分看,标准分大的考试成绩更好.请问A同学在本次考试中,数学与英语哪个学科考得更好?
友情提示:
一组数据的标准差计算公式是:
S=
,其中
为n个数据x1,x2,…xnr的平均数.
〖参考答案〗解:
(1)数学考试成绩的平均分
数学=
(71+72+69+68+70)=70
英语考试成绩的标准差
S英语=
=6
(2)设A同学数学考试成绩标准分为P数学,英语考试成绩标准分为P英语,
则P数学=(71﹣70)+
=﹣
;
P英语=(88﹣85)÷6=
;
∵P数学>P英语∴从标准分来看,A同学数学比英语考得更好.
类型四统计量的选择
【例题6】甲、乙两名运动员在6次百米跑训练中的成绩如下表:
(单位:
秒)
请你比较这两组数据的众数、平均数、中位数,并利用这些数据对甲、乙两名运动员进行评价?
〖选题意图〗本题考查了平均数,中位数,众数的意义.平均水平的判断主要分析平均成绩,优秀成绩的判断从中位数不同可以得到,众数比较整体成绩.
〖解题思路〗平均数表示一组数据的平均程度.中位数是将一组数据从小到大(或从大到小)重新排列后,最中间的那个数(最中间两个数的平均数);众数是一组数据中出现次数最多的数据,注意众数可以不止一个.
〖参考答案〗解:
甲:
数据10.8出现2次,次数最多,所以众数是10.8;
平均数=(10.8+10.9+11.0+10.7+11.2+10.8)÷6=10.9;
中位数=(10.8+10.9)÷2=10.85;
乙:
数据10.9出现3次,次数最多,所以众数为10.9;
平均数=(10.9+10.9+10.8+10.8+10.5+10.9)÷6=10.8;
中位数=(10.8+10.9)÷2=10.85;
所以从众数上看,甲的整体成绩优于乙的整体成绩;
从平均数上看,乙的平均成绩优于甲的平均成绩;
从中位数看,甲、乙的成绩一样好.
【课堂训练题】
1.星期天上午,动物圆熊猫馆来了甲、乙两队游客,两队游客的年龄如下表所示:
(1)根据上述数据完成下表:
(2)根据前面的统计分析,回答下列问题:
①能代表甲队游客一般年龄的统计量是 .
②平均数能较好地反映乙队游客的年龄特征吗?
为什么?
〖参考答案〗解:
(1)对于甲队:
平均数为
=
=15;
方差为
(2×4+1+4+2×4)=1.8;
对于乙队:
年龄为6的最多,故众数为6;
题中已将年龄从小到大排列,共10人;找第5、6人的年龄为5、6岁,其平均数为5.5,故中位数是5.5;
(2)①平均数或中位数或众数;
②平均数不能较好地反映乙队游客的年龄特征.因为乙队游客年龄中含有两个极端值,受两个极端值的影响,导致乙队游客年龄方差较大,平均数高于大部分成员的年龄.
2.三个生产日光灯管的厂家在广告中宣称,他们生产的日光灯管在正常情况下,灯管的使用寿命为12个月.工商部门为了检查他们宣传的真实性,从三个厂家各抽取11只日光灯管进行检测,灯管的使用寿命(单位:
月)如下:
甲厂
7
8
9
9
9
11
13
14
16
17
19
乙厂
7
7
9
9
10
10
12
12
12
13
14
丙厂
7
7
8
8
8
12
13
14
15
16
17
(1)这三个厂家的广告,分别利用了统计中的哪一个特征数(平均数、中位数、众数)进行宣传;
(2)如果三种产品的售价一样,作为顾客的你选购哪个厂家的产品?
请说明理由.
〖参考答案〗解:
(1)甲厂的平均数=(7+8+9+9+9+11+13+14+16+17+19)÷11=12,
∴甲厂的广告利用了统计中的平均数;
由于乙厂数据中12有3次,是众数,故乙厂的广告利用了统计中的众数;
丙厂数据中的中位数是12,故丙厂的广告利用了统计中的中位数;
(2)选用甲厂的产品.因为它的平均数较真实地反映灯管的使用寿命.
或选用丙厂的产品.因为丙厂有一半以上的灯管使用寿命超过12个月.
【例题7】下表是甲、乙两人各打靶十次的成绩情况统计表(单位:
环)
根据上面的统计表,制作适当的统计图表示甲、乙两人打靶成绩的变化,并回答下列问题.
(1)谁成绩变化的幅度大?
(2)甲、乙两人哪一次射击的成绩相差最大?
相差多少?
〖选题意图〗极差反映了一组数据变化范围的大小,求极差的方法是用一组数据中的最大值减去最小值.
〖解题思路〗
(1)谁的成绩变化幅度大实际上是比较极差的大小,因为极差反映了一组数据变化范围的大小.
(2)利用极差公式求即可.
〖参考答案〗解:
(1)∵甲中找出数据中最大的值9,最小值5,故极差是4,
乙中找出数据中最大的值10,最小值2,极差是8,
∴乙成绩变化的幅度大;
(2)从数据中找出成绩相差大的是第一次,相差9﹣2=7环.
【课堂训练题】
1.某校初三
(1)班、
(2)班各有49名学生,两班在一次数学测验中的成绩统计如下表:
(1)请你对下面的一段话给予简要分析:
初三
(1)班的小刚回家对妈妈说:
“昨天的数学测验,全班平均79分,得70分的人最多,我得了85分,在班里可算上游了!
”
(2)请你根据表中数据,对这两个班的测验情况进行简要分析,并提出教学建议.
〖参考答案〗解:
(1)由中位数可知,85分排在第25位之后,从位次上讲不能说85分是上游;但也不能单纯以位次来判断学习的好坏,小刚得了85分,说明他对这段的学习内容掌握较好,从掌握学习内容上讲也可以说属于上游;
(2)高一
(1)班成绩中位数为87,说明高于87分的人数占一半以上,而平均分为79分,标准差又很大,说明低分也多,两极分化严重,建议加强对学习有困难者的帮助;
高一
(2)班的中位数和平均分均为79分,标准差又很小,说明学生之间差别较小,学习很差的学生少,但学习优秀的学生也很少,建议采取措施提高优秀率.
2.射击集训队在一个月的集训中,对甲、乙两名运动员进行了10次测试,成绩如下:
甲:
9,6,6,8,7,6,6,8,8,6;
乙:
4,5,7,6,8,7,8,8,8,9.
如果你是教练员,会选择哪位运动员参加比赛?
请说明理由.
〖参考答案〗解:
选择甲运动员.
理由如下:
甲的平均数为
=7.0,
乙的平均数为
=7.0,
S甲2=
=1.2,
S乙2=
=2.2,
∴S甲2<S乙2,
∴乙的成绩比较稳定,
∴选择甲运动员参加比赛.
第三部分课后自我检测试卷
A类试题:
1.下列数据:
16,20,22,25,24,25的平均数和中位数分别为( )
A.21和22B.22和23C.22和24D.21和23
2.甲、乙两名学生进行射击练习,两人在相同条件下各射靶5次,射击成绩统计如下:
命中环数(单位:
环)
7
8
9
10
甲命中相应环数的次数
2
2
0
1
乙命中相应环数的次数
1
3
1
0
从射击成绩的平均数评价甲、乙两人的射击水平,则( )
A.甲比乙高B.甲、乙一样C.乙比甲高D.不能确定
3.(2011•滨州)甲、乙两名同学进行射击训练,在相同条件下各射靶5次,成绩统计如下:
命中环数
7
8
9
10
甲命中相应环数的次数
2
2
0
1
乙命中相应环数的次数
1
3
1
0
若从甲、乙两人射击成绩方差的角度评价两人的射击水平,则谁的射击成绩更稳定些?
4.一组数据10,14,20,24,19,16的极差是 .
5.九位学生的鞋号由小到大是:
20,21,21,22,22,22,22,23,23.
这组数据的平均数、中位数和众数哪个指标是鞋厂最不感兴趣的?
哪个指标是鞋厂最感兴趣的?
B类试题:
6.甲,乙两班举行电脑汉字输入速度比赛,参加学生每分钟输入汉字的个数经统计计算后填人下表:
某同学根据上表分析得出如下结论:
①甲,乙两班学生成绩的平均水平相同;②乙班优秀的人数多于甲班优秀的人数(每分钟输入汉字数≥150个为优秀);③甲班的成绩的波动情况比乙班的成绩的波动大.上述结论正确的是( )
A.①②③B.①②C.①③D.②③
7.三五三七鞋厂为了了解初中学生穿鞋的鞋号情况,对红华中学初二
(1)班的20名男生所穿鞋号统计如下表:
(1)写出男生鞋号数据的平均数,中位数,众数;
(2)在平均数,中位数和众数中,鞋厂最感兴趣的是什么?
8.某中学初三
(1)班、
(2)班各选5名同学参加“爱我中华”演讲比赛,其预赛成绩(满分100分)如图所示:
(1)根据上图信息填写下表:
平均数
中位数
众数
初二
(1)班
85
85
初二
(2)班
85
80
(2)根据两班成绩的平均数和中位数,分析哪班成绩较好?
(3)如果每班各选2名同学参加决赛,你认为哪个班实力更强些?
请说明理由.
C类试题:
9.(2011•济宁)某初中学校欲向高一级学校推荐一名学生,根据规定的推荐程序:
首先由本年级200名学生民主投票,每人只能推荐一人(不设弃权票),选出了票数最多的甲、乙、丙三人.图票结果统计如图一:
其次,对三名候选人进行了笔试和面试两项测试.各项成绩如下表所示:
测试项目
测试成绩/分
甲
乙
丙
笔试
92
90
95
面试
85
95
80
图二是某同学根据上表绘制的一个不完全的条形图.
请你根据以上信息解答下列问题:
(1)补全图一和图二;
(2)请计算每名候选人的得票数;
(3)若每名候选人得一票记1分,投票、笔试、面试三项得分按照2:
5:
3的比确定,计算三名候选人的平均成绩,成绩高的将被录取,应该录取谁?
10.芜湖市1985年~2008年各年度专利数一览表
年度
专利数
年度
专利数
年度
专利数
年度
专利数
1985
0
1991
21
1997
56
2003
138
1986
2
1992
27
1998
55
2004
165
1987
3
1993
32
1999
110
2005
184
1988
8
1994
22
2000
71
2006
194
1989
9
1995
19
2001
60
2007
702
1990
13
1996
36
2002
71
2008
1006
(1)请你根据以上专利数数据,求出该组数据的中位数为 ;极差为 ;
(2)请用折线图描述2001年~2008年各年度的专利数;
(3)请你根据这组数据,说出你得到的信息.
课后自我检测试卷参考答案
A类试题:
1.解:
一组数据为16,20,22,25,24,25,
∴平均数=(16+20+22+25+24+25)÷6=22;
把数据按从小到大的顺序排列:
16,20,22,24,25,25,
∴中位数=(22+24)÷2=23.
故选B.
2.解:
由题意知,甲的平均数=
=8环,
乙的平均数=
8环,
所以从平均数看两个一样.
故选B.
3.解:
甲、乙两人射击成绩的平均成绩分别为:
,
,
,
,
∵s甲2<s乙2.
∴乙同学的射击成绩比较稳定.
4.由题意可知,极差为24﹣10=14.
5.解:
鞋厂最不感兴趣的指标是平均数,因为有可能没有一个学生的鞋号等于这个平均数.最感兴趣的指标是众数,因为它表明工厂应该生产最多这一鞋号的鞋.
B类试题:
6.解:
从表中可知,平均字数都是135,
(1)正确;
甲班的中位数是149,乙班的中位数是151,比甲的多,而平均数都要为135,说明乙的优秀人数多于甲班的,
(2)正确;
甲班的方差大于乙班的,又说明甲班的波动情况大,所以(3)也正确.
故选A.
7.解:
(1)由题意知:
男生鞋号数据的平均数=
=24.525;
男生鞋号数据的众数为25;
男生鞋号数据的中位数=
=24.5.
∴平均数是24.525,中位数是24.5,众数是25.
(2)厂家最关心的是众数.
8.解:
(1)中位数填85,众数填100.
(2)因为两班的平均数都相同,但初三
(1)班的中位数高,所以初三
(1)班的成绩较好.
(3)如果每个班各选2名同学参加决赛,我认为初三
(2)班实力更强些.
因为,虽然两班的平均数相同,但在前两名的高分区中初三
(2)班的成绩为100分,而初三
(1)班的成绩为100分和85分.
C类试题:
9.解:
(1)
(2)甲的票数是:
200×34%=68(票),
乙的票数是:
200×30%=60(票),
丙的票数是:
200×28%=56(票);
(3)甲的平均成绩:
,
乙的平均成绩:
,
丙的平均成绩:
,
∵乙的平均成绩最高,
∴应该录取乙.
10.解:
(1)中位数为46,极差为1006;
(2)如图:
(3)芜湖的专利数从无到有,近几年专利数增加迅速.(必须围绕专利数据来谈)