21数据的整理与初步处理.docx

上传人:b****5 文档编号:11536818 上传时间:2023-03-19 格式:DOCX 页数:36 大小:579.91KB
下载 相关 举报
21数据的整理与初步处理.docx_第1页
第1页 / 共36页
21数据的整理与初步处理.docx_第2页
第2页 / 共36页
21数据的整理与初步处理.docx_第3页
第3页 / 共36页
21数据的整理与初步处理.docx_第4页
第4页 / 共36页
21数据的整理与初步处理.docx_第5页
第5页 / 共36页
点击查看更多>>
下载资源
资源描述

21数据的整理与初步处理.docx

《21数据的整理与初步处理.docx》由会员分享,可在线阅读,更多相关《21数据的整理与初步处理.docx(36页珍藏版)》请在冰豆网上搜索。

21数据的整理与初步处理.docx

21数据的整理与初步处理

第21章数据的整理与初步处理2

§21.1 算术平均数与加权平均数2

1.算术平均数的意义2

2.用计算器求算术平均数5

3.加权平均数6

4.扇形统计图的制作7

阅读材料“均贫富”10

§21.2 平均数、中位数和众数的选用11

1.中位数和众数11

2.平均数、中位数和众数的选用13

阅读材料计算机帮我们求平均数、中位数和众数16

§21.3 级差、方差与标准差18

1.表示一组数据离散程度的指标18

2.用计算器求标准差21

阅读材料早穿皮袄午穿纱22

小结23

复习题24

课题学习心率与年龄26

第21章数据的整理与初步处理

从图上看一年中北京气温变化的幅度比新加坡气温变化的幅度大,但是你知道如何通过计算比较这两地气温变化幅度的大小吗?

§21.1 算术平均数与加权平均数

1.算术平均数的意义

解决一些与不确定现象有关的问题,常常离不开收集和分析数据,数据是我们思考的基础.那么,有了一组数据以后,怎样表达和概括这一组数据呢?

能否找到某些指标作为这组数据的代表呢?

我们在小学已经学过的算术平均数经常就被用来作为一组数据的代表.

回顾

 

表21.1.1给出了某户居民2005年下半年的电话费用,请你帮这户居民算一算:

平均每月花费了多少元电话费?

表21.1.1某户居民2005年7—12月电话费用统计表

月份

7

8

9

10

11

12

电话费(元)

75.80

45.00

76.30

65.90

55.90

45.90

例1植树节到了,某单位组织职工开展植树竞赛,图21.1.1反映的是植树量与人数之间的关系.请根据图中信息计算:

(1)总共植树多少棵?

(2)平均每人植树多少棵?

(1)3×8+4×1+5×10+6×8+7×3+8×1=155,

所以,总共植树155棵.

(2)

=5,

所以,平均每人植树5棵.

思考

你发现植树总量、植树量的平均数和人数这三者之间的数量关系了吗?

例2丁丁所在的初二

(1)班共有学生40人.图21.1.2是该校初二年级各班学生人数分布情况.

(1)请计算该校初二年级每班平均人数;

(2)请计算各班学生人数,并绘制条形统计图.

 

(1)40÷20%=200(人),200÷5=40(人),所以,该校初二年级每班平均40人.

(2)

(2)班:

200×23%=46(人);

(3)班:

200×22%=44(人);

(4)班:

200×17%=34(人);

(5)班:

200×18%=36(人).

可以绘制如图21.1.3(a)的条形统计图来表示该校初二年级各个班级的人数情况:

思考

如图21.1.3(b),在你所绘制的条形统计图中画出一条代表平均人数40的水平线.图中代表各班人数的五个条形,有的位于这条线的上方,有的位于它的下方.想一想,水平线上方超出部分之和与下方不足部分之和在数量上有什么关系?

练习

1甲乙两所学校号召学生们向希望小学捐赠图书.已知甲校800名学生平均每人捐书4.5本;乙校学生比甲校少80人.如果要达到相同的捐书总量,那么乙校学生平均每人要捐书多少本?

2某省统计数据显示,2005年1—6月平均每月进出口总额为82.445亿美元.下图是根据该省2005年上半年每月的进出口总额情况绘制的.不计算出口总额,你能将缺少的一点补在虚线恰当的位置上吗?

2.用计算器求算术平均数

当数据个数很多时,用计算器计算算术平均数显得非常简便.我们只要按照指定的顺序按键,便可得到计算结果.

以前面某户居民2005年7—12月电话费这组数据为例,按键顺序如下:

1

,打开计算器;

2

,启动统计计算功能;

3

……

,输入所有数据;

4

(STAT)

,计算出这组数据的算术平均数.

你还可以根据计算器使用说明书动手试一试,怎样修改已经输入的数据,怎样简便地输入多个相同数据.

练习

1试用计算器算出以下各组数据的算术平均数:

(1)5,5,6,6,6,7,8,8,8,8;

(2)2578,364,98,46523;

(3)41,32,53,43,56,26,37,58,69,15.

2有一组数据的算术平均数等于7,参考上题计算算术平均数获得的经验,判断下列说法是否正确,错误的请举出一个反例:

(1)如果这组数据共有三个,且其中一个大于7,那么必有一个小于7;

(2)如果这组数据共有四个,且其中两个小于7,那么必有两个大于7.

3.加权平均数

在日常生活中,我们经常会与平均数打交道,但有时发现以前计算平均数的方法并不适用.〖〗你知道为什么要这样计算吗?

例如老师在计算学生每学期的总评成绩时,不是简单地将一个学生的平时成绩与考试成绩相加除以2,作为该学生的总评成绩,而是按照“平时成绩占40%,考试成绩占60%”的比例计算(如图21.1.4),考试成绩更为重要.这样如果一个学生的平时成绩为70分,

考试成绩为90分,那么他的学期总评成绩就应该为

70×40%+90×60%=82(分).

一般来说,由于各个指标在总结果中占有不同的重要性,因而会被赋予不同的权重,上例中的40%与60%就是平时成绩与考试成绩在学期总评成绩中的权重,最后计算得到的学期总评成绩82分就是上述两个成绩的加权平均数(weightedmean).

小青在初一年级第二学期的数学成绩分别为:

测验一得89分,测验二得78分,

测验三得85分,期中考试得90分,期末考试得87分.如果按照图21.1.5所显示的平时、期中、期末成绩的权重,那么小青该学期的总评成绩应该为多少分?

例3某公司对应聘者A、B、C、D进行面试,并按三个方面给应聘者打分,最后打分结果如表21.1.2所示.如果你是人事主管,会录用哪一位应聘者?

表21.1.2四位应聘者的面试成绩

满分

A

B

C

D

专业知识

20

14

18

17

16

工作经验

20

18

16

14

16

仪表形象

20

12

11

14

16

分析甲同学说:

看谁的总分高就录用谁.通过计算可以发现D的总分最高,应被录用.

这时乙同学说:

我有不同意见.三个方面满分都是20分,但按理这三个方面的重要性应该有所不同,比如专业知识就应该比仪表形象更重要.

讨论假设上述三个方面的重要性之比为6∶3∶1(如图2116),那么应该录用谁呢?

解因为6∶3∶1=60%∶30%∶10%,所以专业知识、工作经验与仪表形象这三个方面的权重分别是60%、30%与10%.

这样A的最后得分为

14×60%+18×30%+12×10%=15.

请你根据这样的权重要求,继续算出另三位应聘者的最后得分.从你的计算结果看,谁应被录用?

思考

如果这三方面的重要性之比为10∶7∶3,此时哪个方面的权重最大?

哪一位应被录用呢?

练习

一家小吃店原有三个品种的馄饨,其中菜馅馄饨售价为3元/碗,鸡蛋馅馄饨售价为4元/碗,肉馅馄饨售价为5元/碗.每碗有10个馄饨.该店新增了混合馄饨,每碗3个菜馅的、3个鸡蛋馅的、4个肉馅的.算一算,混合馄饨每碗的定价该是多少?

如果混合馄饨的定价是3.8元,你觉得三个品种的馄饨可以如何合理搭配?

思考

商店里有两种苹果,一种单价为3.50元/千克,另一种单价为4元/千克.如果妈妈各买了2千克,那么妈妈所买苹果的平均价格为(3.50+4)÷2=3.75元/千克,这种算法对吗?

为什么?

如果妈妈买了单价为3.50元/千克的苹果1千克,单价为4元/千克的苹果3千克,那么这种算法对吗?

为什么?

例4一架电梯的最大载重是1000千克.现有13位“重量级”的乘客要搭乘电梯,已知其中11位先生的平均体重是80千克,2位女士的平均体重是70千克.请问他们能否一起安全地搭乘这架电梯?

他们的平均体重是多少千克?

解11位先生的总体重=80×11=880(千克).

2位女士的总体重=70×2=140(千克).

13位乘客的总体重=880+140=1020(千克).

因为总体重超过了电梯的最大载重,所以他们不能一起安全地搭乘.

13位乘客的平均体重=1020÷13≈78.5(千克).这是一个已知两个平均数再求总平均数的问题,解这类问题一般不能采取“相加除以2”的平均化策略,因为两个方面的权重常常不相等.

练习

某人在A商店买了2包饼干,单价是2.20元.走了没多远,看见B商店也有卖这种饼干的,每包1.80元,他又买了3包.请先估计一下他买5包饼干的平均价格是小于、等于还是大于2元,然后再算出5包饼干的平均价格,看看你的估计对不对.

4.扇形统计图的制作

在日常生活中我们会见到和用到各种各样的统计图,扇形统计图(sectordiagram)就是其中的一种.

问题1

在某所医院的健康宣传栏里有一幅海报,如图21.1.7.显然,这样的统计图比文字更具有表现力.

图中各个扇形分别代表了什么?

人们失去牙齿最主要的原因是什么?

对于不同年龄的人群,情况有没有不同?

图21.1.7的每个圆中所有扇形表示的百分比之和为多少?

量一量,每个扇形的圆心角度数是多少?

同一个扇形图中各扇形圆心角的大小与图上所标的相应百分比之间有什么关系?

因为扇形统计图可以清楚地告诉我们各部分数量占总数量的百分比,所以我们在表示各部分数量在总量中所占份额时常常使用扇形统计图.

问题2

2002年12月3日22点16分,从摩纳哥蒙特卡洛举行的国际展览局大会上传来了振奋人心的消息——中国当选为2010年世博会的东道主!

选举由国际展览局89个成员国的代表以无记名投票方式进行.

在首轮投票中,中国以36票居第一,韩国28票,俄罗斯12票,墨西哥6票,波兰被淘汰;

在第二轮投票中,中国获38票,韩国34票,俄罗斯10票,墨西哥遭淘汰;

在第三轮投票中,中国获44票,韩国32票,俄罗斯被淘汰;

在最后一轮投票中,中国以54票胜出.

(消息来源

怎样用扇形统计图表示各国得票数占总票数的百分比?

以首轮投票的结果为例:

中国得票数占总票数的百分比为

36÷89≈40.45%,

如图21.1.8,反映在扇形统计图上,扇形圆心角的度数应为

360°×40.45%≈145.6°.

你能将韩国、俄罗斯、墨西哥的该轮得票率补充在上面的扇形统计图中吗?

如果条件允许,请借助计算机中的Excel软件绘制这幅扇形统计图,看看是不是又快又好.

练习

1某省2001年粮食总产量为2500.3万吨,其中,夏粮804.2万吨,早稻147.3万吨,秋粮1548.8万吨.如果用扇形统计图表示这组数据,各部分扇形的圆心角分别约为多少度?

(精确到0.1°)

2根据下表,你能用扇形统计图把各大洲土地面积占全球土地总面积的百分比表示出来吗?

有条件的话,请尝试用计算机中的Excel软件帮你作图.(精确到0.1%)

七大洲土地面积表

洲名

亚洲

非洲

欧洲

北美洲

南美洲

大洋洲

南极洲

土地面积(万平方千米)

4400

3020

1016

2422.8

1797

897

1400

32002年10月12日《青年报》第2版刊载了下面的扇形统计图.

(1)从图上看,被调查者对目前的医疗服务价格是如何评价的?

(2)有人说这幅图有问题,你看出来了吗?

(数据来源:

中国经济景气监测中心)

习题21.1

1在一批圆柱形机器零件中抽出20件.测得直径如下(单位:

mm):

56.1,55.9,55.9,56.0,55.8,56.1,55.7,55.6,56.3,56.2,

56.2,55.7,56.3,56.1,56.2,56.2,55.9,55.8,56.0,56.0.

计算这些零件的平均直径.想一想,有哪些不同的算法?

22002年4月11日《文汇报》报道,据不完全统计,至今上海自愿报名去西部地区工作的专业技术人员和管理人员已达3600多人,其中硕士、博士占4%,本科学历占79%,大专学历占13%.根据上述数据绘制扇形统计图表示这些人员的学历分布情况.

3第一组数据:

10,10;第二组数据:

20,20,20;第三组数据:

30,30,30,30,30.请问每组数据的算术平均数分别是多少?

如果将这三组数据合成一组新的数据,请问新数据的算术平均数是多少?

4不用计算,根据条形统计图你能判断哪个班级学生的平均成绩高吗?

5某同学在这学期的前四次数学测验中得分依次为95、82、76和88,马上要进行第五次数学测验了,她希望五次成绩的算术平均数能够达到或超过85分,那么,这次测验她至少要考多少分?

6已知一组数据:

0,1,3,3,3,5,6,7,9,10,在计算这组数据的算术平均数时,甲、乙、丙三位同学列出了不同的算式,请你帮他们判断对错,并说说理由.

甲:

(1+3+3+3+5+6+7+9+10)÷9;

乙:

(0+1+3+5+6+7+9+10)÷8;

丙:

(0+1+3×3+5+6+7+9+10)÷10.

7中秋节到了,某班40名同学举行赏月联欢活动,有8位同学带来了月饼,数量如下:

6,7,5,3,5,10,4,10.如果在全班同学中平分这些月饼,那么每人可以分得多少?

阅读材料

“均贫富”

一组数据的平均数是什么含义?

也许你会打个比方:

有一组数据1,1,2,3,是我们每人手头现有的钱(单位:

元),现在,我们四个人决定均贫富,大家将钱全都集中到一起,一共是7元,然后再将这些钱平分给每个人,那么,每人都分到1.75元,这1.75就是原来那组数据的平均数.不错,汇总然后平分这既是计算平均数的过程,也是从不平均到平均的过程.

在这组数据中,凡是比平均数大的数与平均数的差都是正数,比平均数小的数与平均数的差都是负数,与平均数一样大的数(如果有的话)与平均数的差恰好为零.那么将所有的差相加答案会是什么呢?

尝试一下,就以这组数据为例,所有的差之和是

(1-1.75)+(1-1.75)+(2-1.75)+(3-1.75)

=(-0.75)+(-0.75)+0.25+1.25

=(-1.5)+1.5

=0.

经过均贫富,两个原来只有1元钱的人都额外得到了0.75元,他们得到的这1.5元正是另外两个人一起付出的1.5元,正负相抵,相加应该为零.从图上看,两条细线长度之和与两条粗线长度之和也恰好相等.

一般地,假如这组数据是由a、b、c、d四个数组成的,它们的平均数是m,那么,所有的差相加是

(a-m)+(b-m)+(c-m)+(d-m)

=(a+b+c+d)-4m

=4m-4m=0.

假如这组数据是由五个或更多数字组成的,我们也一样可以证明这组数据中每个数与平均数的差相加是零.

§21.2 平均数、中位数和众数的选用

一组数据的代表,除了我们已经学习过的平均数(mean)以外,常用的还有中位数(median)和众数(mode).

1.中位数和众数

例1据中国气象局2001年8月23日8时预报,我国大陆各直辖市和省会城市当日的最高气温(℃)如表21.2.1所示,请分别用平均数(此为算术平均数)、中位数和众数代表这31个城市当日最高气温这组数据.

表21.2.12001年8月23日8时预报的各地当日最高气温(℃)

北京

32

天津

33

石家庄

36

太原

31

呼和浩特

27

沈阳

27

长春

26

哈尔滨

26

上海

34

南京

32

杭州

32

合肥

32

福州

36

南昌

30

济南

33

郑州

34

武汉

31

长沙

29

广州

35

海口

35

南宁

36

成都

29

重庆

27

贵阳

24

昆明

23

拉萨

21

西安

33

兰州

28

银川

30

西宁

26

乌鲁木齐

29

(1)平均数:

32+33+36+31+27+27+26+26+

34+32+32+32+36+30+33+34+

31+29+35+35+36+29+27+24+

23+21+33+28+30+26+29

=937,

937÷31≈30.2.

所以,这些城市当日预报最高气温的平均数约为30.2℃.

(2)中位数:

如图21.2.1,将31个城市的气温数据按由低到高的顺序重新排列,用去掉两端逐步接近正中心的办法可以找出处在正中间位置的那个值,即中位数.

所以,这些城市当日预报最高气温的中位数是31℃.

思考

如果是偶数个城市,那么用去掉两端逐步接近正中心的办法,最后也只剩下惟一一个没被划去的数据吗?

如果是偶数个城市,那么最后就将剩下两个处在正中间的数,这时,为了公正起见,我们取这两个数的算术平均数作为中位数.

 

(3)众数:

如表21.2.2,统计每一气温在31个城市预报最高气温数据中出现的频数,可以找出频数最多的那个气温值,它就是众数.

表21.2.2

气温℃

21

23

24

26

27

28

29

30

31

32

33

34

35

36

频数

1

1

1

3

3

1

3

2

2

4

3

2

2

3

由表21.2.2可知,这些城市当日预报最高气温的众数是32℃.

思考

若有两个气温(如29℃和32℃)的频数并列最多,那么怎样决定众数呢?

如果这样,那么我们不是取29℃和32℃这两个数的平均数作为众数,而是说这两个气温值都是众数.

我们可以把例1中的平均数、中位数和众数在统计图上表示出来,如图21.2.2.

平均数是概括一组数据的一种常用指标,反映了这组数据中各数据的平均大小.

中位数是概括一组数据的另一种指标,如果将一组数据按由小到大的顺序排列(即使有相等的数据也要全部参加排列),那么中位数的左边和右边恰有一样多的数据.

众数告诉我们,这个值出现的次数最多.一组数据可以有不止一个众数,也可以没有众数.

平均数、中位数和众数从不同的侧面概括了一组数据,正因为如此,这三个指标都可作为一组数据的代表.

例2一名警察在高速公路上随机观察了6辆过往车辆,它们的车速分别为(单位:

千米/时):

66,57,71,54,69,58.那么,这6辆车车速的中位数和众数是什么呢?

解将6辆车的速度按从小到大的顺序重新排列,得到54,57,58,66,69,71.位于正中间的数值不是一个而是两个,所以应取这两个数值的平均数作为中位数,即中位数是(58+66)÷2=62(千米/时).因为每辆车的速度都不一样,没有哪个车速出现的次数比别的多,所以这6辆车的速度没有众数.

练习

1判断题:

(正确的打“√”,不正确的打“×”)

(1)给定一组数据,那么这组数据的平均数一定只有一个.()

(2)给定一组数据,那么这组数据的中位数一定只有一个.()

(3)给定一组数据,那么这组数据的众数一定只有一个.()

(4)给定一组数据,那么这组数据的平均数一定位于最大值和最小值之间.

()

(5)给定一组数据,那么这组数据的中位数一定等于最小值和最大值的算术平均数.()

(6)给定一组数据,如果找不到众数,那么众数一定就是0.()

2某商场进了一批苹果,每箱苹果质量约5千克.进入仓库前,从中随机抽出10箱检查,称得10箱苹果的质量如下(单位:

千克):

4.8,5.0,5.1,4.8,4.9,4.8,5.1,4.9,4.7,4.7.请指出这10箱苹果质量的平均数、中位数和众数.

2.平均数、中位数和众数的选用

从前面的学习内容我们知道,平均数、中位数和众数都是用来代表一组数据的,而且,它们互相之间可以相等也可以不相等,没有固定的大小关系.当它们不全相等的时候,就产生如何选用才恰当的问题了.

让我们先来讨论一个同学之间互相比较成绩的问题.

例3八年级某班的教室里,三位同学正在为谁的数学成绩最好而争论,他们的5次数学成绩分别是:

小华:

62,94,95,98,98;

小明:

62,62,98,99,100;

小丽:

40,62,85,99,99.

他们都认为自己的成绩比另两位同学好,你看呢?

分析根据表21.2.3,小华说他的成绩平均数最高,所以他成绩最好;小明说应该比较中位数,他的成绩中位数最高;小丽则说应该比较众数,她是三人中成绩众数最高的人.

表21.2.3

平均数

中位数

众数

小华

89.4

95

98

小明

84.2

98

62

小丽

77

85

99

从三人的测验分数对照图21.2.3来看,你认为哪一个同学的成绩最好呢?

例4随着汽车的日益普及,越来越多的城市发生了令人头痛的交通堵塞问题.你认为用过往车辆一天车速的平均数衡量某条交通主干道的路况合适吗?

分析人们上、下班的时候是一天中道路最繁忙的两个时段,其他时段车流量明显减少,因此,如果用一天车速的平均数来衡量道路的路况,那么上、下班交通堵塞的问题就给掩盖了.所以,较为合理的是按道路繁忙的不同程度,将一天分为几个时段分别计算平均车速.

平均数、中位数和众数各有其长,也各有其短,下面的几个例子也许能让你对它们了解得更深.

▲那边草地上有6个人正在玩游戏,他们年龄的平均数是15岁.请想象一下是怎样年龄的6个人在玩游戏.

通常人们会想象是一群中学生在玩游戏,但是,如果是一个65岁的大娘领着5个5岁的孩子在玩游戏也是有可能的嘛!

这是一个不适合用平均数而适合用众数或中位数代表一组数据的例子,大娘的年龄把平均年龄一下子给抬上去了.

▲为筹备班级里的新年晚会,班长对全班同学爱吃哪几种水果作了民意调查.最终买什么水果,该由调查数据的平均数、中位数还是众数决定呢?

当然由众数决定,因为各种水果喜好人数的平均数或中位数都没什么意义.

▲八年级有4个班级,如果已知在一次测验中这4个班级每班的平均分,也知道各班级的学生人数,那么,我们可以计算出整个年级的平均分,但是,如果已知的是每个班级的中位数或者众数,那么我们是没有办法得出整个年级的中位数或者众数的.请老师准备一根绳子.面对所有学生,捏住绳子的两端,将绳子拉直,请全班同学目测几秒钟后估计这根绳子的长度.

请全班同学设计和完成一张统计表和一张统计图,全面反映每个同学对这根绳子长度的估计值,计算出全班同学估计值的平均数、中位数和众数.

在全班同学估计值的基础上,请给出一个最后的估计值,作为全班集体对这根绳子长度的估计值.

最后,教师重新出示这根绳子,请学生代表当众用尺量出这根绳子的长度.这个测量值与全班同学目测的估计值接近吗?

全班讨论一下比较的结果,为什么测量值与估计值相差不大或者相差较

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 医药卫生 > 基础医学

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1