数据的分析.docx

上传人:b****8 文档编号:10451727 上传时间:2023-02-11 格式:DOCX 页数:23 大小:249.26KB
下载 相关 举报
数据的分析.docx_第1页
第1页 / 共23页
数据的分析.docx_第2页
第2页 / 共23页
数据的分析.docx_第3页
第3页 / 共23页
数据的分析.docx_第4页
第4页 / 共23页
数据的分析.docx_第5页
第5页 / 共23页
点击查看更多>>
下载资源
资源描述

数据的分析.docx

《数据的分析.docx》由会员分享,可在线阅读,更多相关《数据的分析.docx(23页珍藏版)》请在冰豆网上搜索。

数据的分析.docx

数据的分析

数据的分析

第一部分知识梳理

一、数据的代表

1.平均数的概念

(1)平均数:

一般地,如果有n个数

那么,

叫做这n个数的平均数。

(2)加权平均数:

如果n个数中,

出现

次,

出现

次,…,

出现

次(这里

),那么,根据平均数的定义,这n个数的平均数可以表示为

,这样求得的平均数

叫做加权平均数,其中

叫做权。

2.众数:

在一组数据中,出现次数最多的数据叫做这组数据的众数。

3.中位数:

将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数。

二、数据的波动

1.方差的概念:

在一组数据

中,各数据与它们的平均数

的差的平方的平均数,叫做这组数据的方差。

通常用“

”表示,即

2.标准差:

方差的算数平方根叫做这组数据的标准差,用“s”表示,即

第二部分例题与解题思路方法归纳

类型一平均数

【例题1】(2010•宁德)下表是中国2010年上海世博会官方网站公布的5月某一周入园参观人数,则这一周入园参观人数的平均数是  万.

〖选题意图〗本题考查的是样本平均数的求法,熟记公式是解决本题的关键.

〖解题思路〗只要运用平均数公式:

,即可求出.

〖参考答案〗解:

平均数=(36.12+31.14+31.4+34.42+35.26+37.7+38.12)÷7≈34.88(万),

所以这一周入园参观人数的平均数是34.88万.

故填34.88.

【课堂训练题】

1.某酒店共有6名员工,所有员工的工资如下表所示:

(1)酒店所有员工的平均月工资是多少元?

(2)平均月工资能准确反映该酒店员工工资的一般水平吗?

若能,请说明理由.若不能,如何才能较准确地反映该酒店员工工资的一般水平?

谈谈你的看法.

〖参考答案〗解:

(1)平均月工资=(4000+600+900+500+500+400)÷6=1150(元),

(2)∵能达到这个工资水平的只有2人,

∴平均月工资不能准确反映该酒店员工工资的一般水平,这组数据的众数是500元,才能较准确地反映该酒店员工工资的一般水平,原因是它符合多数人的工资水平.

2.某企业招工广告中称,本企业所有员工的平均工资为2000元/月,如果是事实,你愿意受聘于该企业吗?

〖参考答案〗解:

不一定.

因为可能比2000元高的员工的工资的平均工资比全部的平均工资高的多,

比2000元低的员工的工资的平均数比全部的平均数低得多,

那么平均工资为2000元,这个数不能说明大多数员工的工资,

因此不一定去;

如果2000元是中位数,还是能够去的.

【例题2】在“情系玉树献爱心”捐款活动中,某校九

(1)班同学人人拿出自己的零花钱,现将同学们的捐款数整理成统计表,则该班同学平均每人捐款元  .

捐款数(元)

5

10

20

50

人数

4

15

6

5

〖选题意图〗本题考查的是加权平均数的求法.熟记公式是解决本题的关键.

〖解题思路〗平均数是指在一组数据中所有数据之和再除以数据的个数.

〖参考答案〗解:

(5×4+10×15+20×6+50×5)÷30=18元,

∴该班同学平均每人捐款18元.故填18.

【课堂训练题】

1.某生数学科课堂表现为90分、平时作业为92分、期末考试为85分,若这三项成绩分别按30%、30%、40%的比例计入总评成绩,则该生数学科总评成绩是  分.

〖参考答案〗解:

=90×30%+92×30%+85×40%=27+27.6+34=88.6.

2.为了调查某一路口某时段的汽车流量,记录了15天同一时段通过该路口的汽车辆数,其中有2天是142辆,2天是145辆,6天是156辆,5天是157辆,那么这15天通过该路口汽车平均辆数为(  )

A.146B.150C.153D.1600

〖参考答案〗解:

依题意有:

(142×2+145×2+6×156+5×157)÷15=153.故选C.

类型二中位数、众数

【例题3】(2010•鸡西)一组数据:

3,4,9,x,它的平均数比它唯一的众数大1,则x=  .

〖选题意图〗本题考查了确定一组数据众数与平均数的能力.正确运用分类讨论的思想是解答本题的关键.众数是一组数据中出现次数最多的数据,注意众数可以不止一个.

〖解题思路〗众数可能是3,也可能是4或9,因此应分众数是3或4或9三种情况进行讨论.

〖参考答案〗解:

当众数为3时,(3+4+9+x)÷4=4,则x=0;

当众数为4时,(3+4+9+x)÷4=5,则x=4;

当众数为9时,(3+4+9+x)÷4=10,则x=24.

∴x=0,4或24.

当x=0,24时,没有众数

∴x=4

故答案为4.

【课堂训练题】

1.100名学生进行20秒钟跳绳测试,测试成绩统计如下表:

跳绳个数x

20<x≤30

30<x≤40

40<x≤50

50<x≤60

60<x≤70

x>70

人数

5

2

13

31

23

26

则这次测试成绩的中位数m满足(  )

A.40<m≤50B.50<m≤60C.60<m≤70D.m>70

〖参考答案〗解:

∵一共有100名学生参加测试,

∴中位数应该是第50名和第51名成绩的平均数,

∵第50名和第51名的成绩均在50<x≤60,

∴这次测试成绩的中位数m满足50<x≤60,

故选B.

2.在“庆祝建党90周年的红歌传唱活动”比寒中,七位评委给某参赛队打的分数为:

92、86、88、87、92、94、86,则去掉一个最高分和一个最低分后,所剩五个分数的平均数和中位数是(  )

A.89,92B.87,88C.89,88D.88,92

〖参考答案〗解:

根据去掉一个最高分和一个最低分后,所剩五个分数的平均数为:

平均数:

(92+86+88+87+92)÷5=89,故平均数是89;

将数据按从小到大的顺序排列得:

86、87、88、92、92.

最中间的年龄是88,

故中位数是88.故选:

C.

类型三极差、方差和标准差

【例题4】一组数据3,x,0,﹣1,﹣3的平均数是1,则这组数据的极差为  .

 

〖选题意图〗本题考查了极差的定义,求极差的方法是用一组数据中的最大值减去最小值.

〖解题思路〗根据平均数的定义即可求得x的值,进而得到这组数据的极差.

〖参考答案〗解:

根据题意得:

3+x+0﹣1﹣3=1×5,解得x=6.

则这组数的极差是6﹣(﹣3)=9.

【课堂训练题】

1.“恒盛”超市购进一批大米,大米的标准包装为每袋30kg,售货员任选6袋进行了称重检验,超过标准重量的记作“+”,不足标准重量的记作“﹣”,他记录的结果是+0.5,﹣0.5,0,﹣0.5,﹣0.5,+1,那么这6袋大米重量的平均数和极差分别是(  )

A.0,1.5B.29.5,1C.30,1.5D.30.5,0

〖参考答案〗解:

平均数:

30+(0.5﹣0.5+0﹣0.5﹣0.5+1)÷6=30(kg),

极差:

(30+1)﹣(30﹣0.5)=1.5(kg),故选:

C.

2.一组数据为1,5,3,4,5,6,这组数据的极差、众数、中位数分别为(  )

A.5,4,5B.5,5,4.5C.5,5,4D.5,3,2

〖参考答案〗解:

先对这组数据按从小到大的顺序重新排序:

1,3,4,5,5,6.

位于最中间的数是4和5,

∴这组数的中位数是4.5.

这组数出现次数最多的是5,

∴这组数的众数是5

极差为:

6﹣1=5.

故选B.

【例题5】博才中学要从甲、乙两名同学中选拔一名同学代表学校参加“华罗庚金杯”数学竞赛活动.这两位活动同学最近四次的数学测验成绩如下表:

(单位:

分)

第一次

第二次

第三次

第四次

75

70

85

90

85

82

75

78

(1)根据表中数据,分别求出甲、乙两名同学这四次数学测验成绩的平均分.

(2)经计算,甲、乙两位同学这四次数学测验成绩的方差分别为S甲2=62.5,S乙2=14.5,你认为哪位同学的成绩较稳定?

请说明理由.

〖选题意图〗本题考查了方差、平均数,方差的意义:

方差是用来衡量一组数据波动大小的量,方差越大,表明这组数据偏离平均数越大,即波动越大,数据越不稳定;反之,方差越小,表明这组数据分布比较集中,各数据偏离平均数越小,即波动越小,数据越稳定.

〖解题思路〗

(1)由平均数的公式计算即可;

(2)方差越小,成绩越稳定,反之,方差越大,成绩越不稳定.

〖参考答案〗解:

(1)

甲=

(75+70+85+90)=80,

乙=

(75+78+85+82)=80,

(2)∵S甲2=62.5,S乙2=14.5,

∴S甲2>S乙2,

∴乙的成绩稳定,因为甲的方差大于乙的方差.

【课堂训练题】

1.王大伯几年前承包了甲、乙两片荒山,各栽100棵杨梅树,成活98%.现已挂果,经济效益初步显现,为了分析收成情况,他分别从两山上随意各采摘了4棵树上的杨梅,每棵的产量如折线统计图所示.

(1)分别计算甲、乙两山样本的平均数,并估算出甲、乙两山杨梅的产量总和;

(2)试通过计算说明,哪个山上的杨梅产量较稳定?

〖参考答案〗解:

(1)

(千克),

(千克),

总产量为40×100×98%×2=7840(千克);

(2)

(千克2),

(千克2),

∴S2甲>S2乙.

答:

乙山上的杨梅产量较稳定.

2.一次期中考试中,A、B、C、D、E五位同学的数学、英语成绩等有关信息如下表所示:

(单位:

分)

(1)求这五位同学在本次考试中数学成绩的平均分和英语成绩的标准差;

(2)为了比较不同学科考试成绩的好与差,采用标准分是一个合理的选择,标准分的计算公式是:

标准分=(个人成绩一平均成绩)÷成绩标准差.

从标准分看,标准分大的考试成绩更好.请问A同学在本次考试中,数学与英语哪个学科考得更好?

友情提示:

一组数据的标准差计算公式是:

S=

,其中

为n个数据x1,x2,…xnr的平均数.

〖参考答案〗解:

(1)数学考试成绩的平均分

数学=

(71+72+69+68+70)=70

英语考试成绩的标准差

S英语=

=6

(2)设A同学数学考试成绩标准分为P数学,英语考试成绩标准分为P英语,

则P数学=(71﹣70)+

=﹣

P英语=(88﹣85)÷6=

∵P数学>P英语∴从标准分来看,A同学数学比英语考得更好.

类型四统计量的选择

【例题6】甲、乙两名运动员在6次百米跑训练中的成绩如下表:

(单位:

秒)

请你比较这两组数据的众数、平均数、中位数,并利用这些数据对甲、乙两名运动员进行评价?

〖选题意图〗本题考查了平均数,中位数,众数的意义.平均水平的判断主要分析平均成绩,优秀成绩的判断从中位数不同可以得到,众数比较整体成绩.

〖解题思路〗平均数表示一组数据的平均程度.中位数是将一组数据从小到大(或从大到小)重新排列后,最中间的那个数(最中间两个数的平均数);众数是一组数据中出现次数最多的数据,注意众数可以不止一个.

〖参考答案〗解:

甲:

数据10.8出现2次,次数最多,所以众数是10.8;

平均数=(10.8+10.9+11.0+10.7+11.2+10.8)÷6=10.9;

中位数=(10.8+10.9)÷2=10.85;

乙:

数据10.9出现3次,次数最多,所以众数为10.9;

平均数=(10.9+10.9+10.8+10.8+10.5+10.9)÷6=10.8;

中位数=(10.8+10.9)÷2=10.85;

所以从众数上看,甲的整体成绩优于乙的整体成绩;

从平均数上看,乙的平均成绩优于甲的平均成绩;

从中位数看,甲、乙的成绩一样好.

【课堂训练题】

1.星期天上午,动物圆熊猫馆来了甲、乙两队游客,两队游客的年龄如下表所示:

(1)根据上述数据完成下表:

(2)根据前面的统计分析,回答下列问题:

①能代表甲队游客一般年龄的统计量是  .

②平均数能较好地反映乙队游客的年龄特征吗?

为什么?

〖参考答案〗解:

(1)对于甲队:

平均数为

=

=15;

方差为

(2×4+1+4+2×4)=1.8;

对于乙队:

年龄为6的最多,故众数为6;

题中已将年龄从小到大排列,共10人;找第5、6人的年龄为5、6岁,其平均数为5.5,故中位数是5.5;

(2)①平均数或中位数或众数;

②平均数不能较好地反映乙队游客的年龄特征.因为乙队游客年龄中含有两个极端值,受两个极端值的影响,导致乙队游客年龄方差较大,平均数高于大部分成员的年龄.

2.三个生产日光灯管的厂家在广告中宣称,他们生产的日光灯管在正常情况下,灯管的使用寿命为12个月.工商部门为了检查他们宣传的真实性,从三个厂家各抽取11只日光灯管进行检测,灯管的使用寿命(单位:

月)如下:

甲厂

7

8

9

9

9

11

13

14

16

17

19

乙厂

7

7

9

9

10

10

12

12

12

13

14

丙厂

7

7

8

8

8

12

13

14

15

16

17

(1)这三个厂家的广告,分别利用了统计中的哪一个特征数(平均数、中位数、众数)进行宣传;

(2)如果三种产品的售价一样,作为顾客的你选购哪个厂家的产品?

请说明理由.

〖参考答案〗解:

(1)甲厂的平均数=(7+8+9+9+9+11+13+14+16+17+19)÷11=12,

∴甲厂的广告利用了统计中的平均数;

由于乙厂数据中12有3次,是众数,故乙厂的广告利用了统计中的众数;

丙厂数据中的中位数是12,故丙厂的广告利用了统计中的中位数;

(2)选用甲厂的产品.因为它的平均数较真实地反映灯管的使用寿命.

或选用丙厂的产品.因为丙厂有一半以上的灯管使用寿命超过12个月.

【例题7】下表是甲、乙两人各打靶十次的成绩情况统计表(单位:

环)

根据上面的统计表,制作适当的统计图表示甲、乙两人打靶成绩的变化,并回答下列问题.

(1)谁成绩变化的幅度大?

(2)甲、乙两人哪一次射击的成绩相差最大?

相差多少?

〖选题意图〗极差反映了一组数据变化范围的大小,求极差的方法是用一组数据中的最大值减去最小值.

〖解题思路〗

(1)谁的成绩变化幅度大实际上是比较极差的大小,因为极差反映了一组数据变化范围的大小.

(2)利用极差公式求即可.

〖参考答案〗解:

(1)∵甲中找出数据中最大的值9,最小值5,故极差是4,

乙中找出数据中最大的值10,最小值2,极差是8,

∴乙成绩变化的幅度大;

(2)从数据中找出成绩相差大的是第一次,相差9﹣2=7环.

【课堂训练题】

1.某校初三

(1)班、

(2)班各有49名学生,两班在一次数学测验中的成绩统计如下表:

(1)请你对下面的一段话给予简要分析:

初三

(1)班的小刚回家对妈妈说:

“昨天的数学测验,全班平均79分,得70分的人最多,我得了85分,在班里可算上游了!

(2)请你根据表中数据,对这两个班的测验情况进行简要分析,并提出教学建议.

〖参考答案〗解:

(1)由中位数可知,85分排在第25位之后,从位次上讲不能说85分是上游;但也不能单纯以位次来判断学习的好坏,小刚得了85分,说明他对这段的学习内容掌握较好,从掌握学习内容上讲也可以说属于上游;

(2)高一

(1)班成绩中位数为87,说明高于87分的人数占一半以上,而平均分为79分,标准差又很大,说明低分也多,两极分化严重,建议加强对学习有困难者的帮助;

高一

(2)班的中位数和平均分均为79分,标准差又很小,说明学生之间差别较小,学习很差的学生少,但学习优秀的学生也很少,建议采取措施提高优秀率.

2.射击集训队在一个月的集训中,对甲、乙两名运动员进行了10次测试,成绩如下:

甲:

9,6,6,8,7,6,6,8,8,6;

乙:

4,5,7,6,8,7,8,8,8,9.

如果你是教练员,会选择哪位运动员参加比赛?

请说明理由.

〖参考答案〗解:

选择甲运动员.

理由如下:

甲的平均数为

=7.0,

乙的平均数为

=7.0,

S甲2=

=1.2,

S乙2=

=2.2,

∴S甲2<S乙2,

∴乙的成绩比较稳定,

∴选择甲运动员参加比赛.

第三部分课后自我检测试卷

A类试题:

1.下列数据:

16,20,22,25,24,25的平均数和中位数分别为(  )

A.21和22B.22和23C.22和24D.21和23

2.甲、乙两名学生进行射击练习,两人在相同条件下各射靶5次,射击成绩统计如下:

命中环数(单位:

环)

7

8

9

10

甲命中相应环数的次数

2

2

0

1

乙命中相应环数的次数

1

3

1

0

从射击成绩的平均数评价甲、乙两人的射击水平,则(  )

A.甲比乙高B.甲、乙一样C.乙比甲高D.不能确定

3.(2011•滨州)甲、乙两名同学进行射击训练,在相同条件下各射靶5次,成绩统计如下:

命中环数

7

8

9

10

甲命中相应环数的次数

2

2

0

1

乙命中相应环数的次数

1

3

1

0

若从甲、乙两人射击成绩方差的角度评价两人的射击水平,则谁的射击成绩更稳定些?

4.一组数据10,14,20,24,19,16的极差是  .

5.九位学生的鞋号由小到大是:

20,21,21,22,22,22,22,23,23.

这组数据的平均数、中位数和众数哪个指标是鞋厂最不感兴趣的?

哪个指标是鞋厂最感兴趣的?

B类试题:

6.甲,乙两班举行电脑汉字输入速度比赛,参加学生每分钟输入汉字的个数经统计计算后填人下表:

某同学根据上表分析得出如下结论:

①甲,乙两班学生成绩的平均水平相同;②乙班优秀的人数多于甲班优秀的人数(每分钟输入汉字数≥150个为优秀);③甲班的成绩的波动情况比乙班的成绩的波动大.上述结论正确的是(  )

A.①②③B.①②C.①③D.②③

7.三五三七鞋厂为了了解初中学生穿鞋的鞋号情况,对红华中学初二

(1)班的20名男生所穿鞋号统计如下表:

(1)写出男生鞋号数据的平均数,中位数,众数;

(2)在平均数,中位数和众数中,鞋厂最感兴趣的是什么?

8.某中学初三

(1)班、

(2)班各选5名同学参加“爱我中华”演讲比赛,其预赛成绩(满分100分)如图所示:

(1)根据上图信息填写下表:

平均数

中位数

众数

初二

(1)班

85

85

初二

(2)班

85

80

(2)根据两班成绩的平均数和中位数,分析哪班成绩较好?

(3)如果每班各选2名同学参加决赛,你认为哪个班实力更强些?

请说明理由.

C类试题:

9.(2011•济宁)某初中学校欲向高一级学校推荐一名学生,根据规定的推荐程序:

首先由本年级200名学生民主投票,每人只能推荐一人(不设弃权票),选出了票数最多的甲、乙、丙三人.图票结果统计如图一:

其次,对三名候选人进行了笔试和面试两项测试.各项成绩如下表所示:

测试项目

测试成绩/分

笔试

92

90

95

面试

85

95

80

图二是某同学根据上表绘制的一个不完全的条形图.

请你根据以上信息解答下列问题:

(1)补全图一和图二;

(2)请计算每名候选人的得票数;

(3)若每名候选人得一票记1分,投票、笔试、面试三项得分按照2:

5:

3的比确定,计算三名候选人的平均成绩,成绩高的将被录取,应该录取谁?

10.芜湖市1985年~2008年各年度专利数一览表

年度

专利数

年度

专利数

年度

专利数

年度

专利数

1985

0

1991

21

1997

56

2003

138

1986

2

1992

27

1998

55

2004

165

1987

3

1993

32

1999

110

2005

184

1988

8

1994

22

2000

71

2006

194

1989

9

1995

19

2001

60

2007

702

1990

13

1996

36

2002

71

2008

1006

(1)请你根据以上专利数数据,求出该组数据的中位数为  ;极差为  ;

(2)请用折线图描述2001年~2008年各年度的专利数;

(3)请你根据这组数据,说出你得到的信息.

课后自我检测试卷参考答案

A类试题:

1.解:

一组数据为16,20,22,25,24,25,

∴平均数=(16+20+22+25+24+25)÷6=22;

把数据按从小到大的顺序排列:

16,20,22,24,25,25,

∴中位数=(22+24)÷2=23.

故选B.

2.解:

由题意知,甲的平均数=

=8环,

乙的平均数=

8环,

所以从平均数看两个一样.

故选B.

3.解:

甲、乙两人射击成绩的平均成绩分别为:

∵s甲2<s乙2.

∴乙同学的射击成绩比较稳定.

4.由题意可知,极差为24﹣10=14.

5.解:

鞋厂最不感兴趣的指标是平均数,因为有可能没有一个学生的鞋号等于这个平均数.最感兴趣的指标是众数,因为它表明工厂应该生产最多这一鞋号的鞋.

B类试题:

6.解:

从表中可知,平均字数都是135,

(1)正确;

甲班的中位数是149,乙班的中位数是151,比甲的多,而平均数都要为135,说明乙的优秀人数多于甲班的,

(2)正确;

甲班的方差大于乙班的,又说明甲班的波动情况大,所以(3)也正确.

故选A.

7.解:

(1)由题意知:

男生鞋号数据的平均数=

=24.525;

男生鞋号数据的众数为25;

男生鞋号数据的中位数=

=24.5.

∴平均数是24.525,中位数是24.5,众数是25.

(2)厂家最关心的是众数.

8.解:

(1)中位数填85,众数填100.

(2)因为两班的平均数都相同,但初三

(1)班的中位数高,所以初三

(1)班的成绩较好.

(3)如果每个班各选2名同学参加决赛,我认为初三

(2)班实力更强些.

因为,虽然两班的平均数相同,但在前两名的高分区中初三

(2)班的成绩为100分,而初三

(1)班的成绩为100分和85分.

C类试题:

9.解:

(1)

(2)甲的票数是:

200×34%=68(票),

乙的票数是:

200×30%=60(票),

丙的票数是:

200×28%=56(票);

(3)甲的平均成绩:

乙的平均成绩:

丙的平均成绩:

∵乙的平均成绩最高,

∴应该录取乙.

10.解:

(1)中位数为46,极差为1006;

(2)如图:

(3)芜湖的专利数从无到有,近几年专利数增加迅速.(必须围绕专利数据来谈)

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 经管营销 > 金融投资

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1