第十九讲 数据的收集与整理.docx

上传人:b****6 文档编号:7984934 上传时间:2023-01-27 格式:DOCX 页数:13 大小:102.73KB
下载 相关 举报
第十九讲 数据的收集与整理.docx_第1页
第1页 / 共13页
第十九讲 数据的收集与整理.docx_第2页
第2页 / 共13页
第十九讲 数据的收集与整理.docx_第3页
第3页 / 共13页
第十九讲 数据的收集与整理.docx_第4页
第4页 / 共13页
第十九讲 数据的收集与整理.docx_第5页
第5页 / 共13页
点击查看更多>>
下载资源
资源描述

第十九讲 数据的收集与整理.docx

《第十九讲 数据的收集与整理.docx》由会员分享,可在线阅读,更多相关《第十九讲 数据的收集与整理.docx(13页珍藏版)》请在冰豆网上搜索。

第十九讲 数据的收集与整理.docx

第十九讲数据的收集与整理

第十九讲数据的收集与整理

一、课标下复习指南

(一)数据的收集和整理

1.全面调查与抽样调查

统计调查分全面调查和抽样调查两种,实际中常采用抽样调查的方式.

(1)考察全体对象的调查属于全面调查.

(2)从总体中抽取样本进行调查,属于抽样调查.抽样调查是根据样本来估计总体的一种调查,简称抽查.抽查体现了用样本估计总体的思想.

(3)总体、个体及样本

总体:

所要考察对象的全体,称为总体;

个体:

总体中的每一个考察对象,称为个体;

样本:

从总体中抽取的一部分个体,称为总体的一个样本.

样本中个体的数目称为样本容量.

说明抽样调查是实际中应用非常广泛的一种调查方式,它是从总体中抽取样本进行调查,根据样本来估计总体的一种调查;常采用问卷调查等调查方式.

用划记法记录数据,通过表格整理数据,可以帮助我们找到数据的分布规律.

说明对于不同的抽样,可能得到不同的结果.

2.频数与频率

(1)频数:

落在不同小组中的数据个数称为该组的频数.

(2)频数与数据总数的比称为频率.频率反映了各组频数在总数中所占的百分比.

3.几种常见的统计图表

(1)条形图

将数据按要求分成若干小组,并用“划记”的方法统计出各小组的频数;再根据统计的频数画出条形图.

(2)扇形图

将数据按要求分成若干小组,统计出各小组的频数,并算出各组的频数占数据总数的百分比;画一个圆,并规定圆的面积表示100%;算出各百分数所对应的扇形的圆心角的度数,用量角器画出各扇形,并标出各百分数.

(3)折线图

以横轴表示统计的时间,纵轴表示数据,建立平面直角坐标系;在坐标平面内描点;用线段从左到右将这些点依次连接起来.

(4)频数分布直方图

用频数分布直方图描述数据的一般步骤为:

计算最大值与最小值的差;确定组距与组数;决定分点;列数频分布表;画频数分布直方图.

①把数据按一定的规律分成组的个数为组数,每一组两个端点的差称为组距.

②数据分组时,对数据要遵循“不重不漏”的原则,既不能有一个数据同时落在两个组内重复出现的现象,也不能有一个数据不在任何组内的遗漏现象;

③频数分布直方图能够显示各组频数的分布情况,易于显示各组之间频数的差别.

(5)频数折线图

频数折线图可以在频数分布直方图的基础上画出来.取频数分布直方图中每一个矩形上边的中点,然后在横轴上取两个频数为0的点,即在直方图的左边和右边各取一个频数为0的点,再用线段从左到右将这些点依次连接起来.

说明利用统计图表示经过整理的数据,能更直观地反映数据规律.

(1)条形图:

能显示具体数据,易于比较数据差别;

(2)扇形图:

用扇形的面积占圆的面积的百分比表示部分在总体中所占百分比,易于显示每组数据相对于总体的大小;

(3)折线图:

易于显示数据的变化趋势;

(4)直方图:

能显示各组频数分布的情况,易于显示各组之间频数的差别.

(二)数据的分析

1.平均数、众数与中位数

(1)算术平均数

(2)加权平均数

如果一组数据中,x1,x2,x3,…,xk出现的次数分别是f1,f2,f3,…,fk,那么这组数据的加权平均数

(3)众数与中位数

①在一组数据中,出现次数最多的数据叫做这组数据的众数(一组数据的众数有时不止一个);

②将一组数据按从小到大(或从大到小)的顺序排列,把处在最中间的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数;

③众数、中位数和平均数从不同的角度描述了一组数据的集中趋势.

(4)平均数、中位数、众数的特征

①平均数、中位数和众数都是数据的代表,它们刻画了一组数据的平均水平;

②平均数容易受极端值的影响,而中位数则不能充分利用所有数据的信息,众数在各个数据的重复次数大致相等时往往没有特别的意义.

2.极差和方差、标准差

(1)极差:

一组数据中数据最大值减去最小值的差叫做这组数据的极差.

①极差用来反映一组数据变化范围的大小,是刻画数据离散程度的最简单的统计量;

②极差受极端值的影响较大,不能反映中间数据的离散情况.

(2)方差:

在一组数据x1,x2,x3,…,xn中,各数据与它的平均数

的差的平方和的平均数叫做这组数据的方差,即

①方差是用来反映一组数据波动情况的特征数,常常用来比较两组数据的波动大小,方差越大,数据的波动越大;方差越小,数据的波动越小;

②方差的单位是原数据单位的平方.

(3)标准差:

一组数据的方差的算术平方根叫做这组数据的标准差,即

*标准差的计算公式:

说明

(1)一组数据的众数可以不唯一,但一定出现在这组数据中;而一组数据的其他统计量都是唯一的,但未必出现在这组数据中;

(2)一组数据都在常数a上下波动,即x'1=x1+a,x2'=x2+a,…,xn'=xn+a时,平均数

;方差s'2=s2.

二、例题分析

例1下列调查方式,合适的是().

A.要了解一批灯泡的使用寿命,采用普查方式

B.要了解甘肃电视台“陇原风貌”栏目的收视率,采用普查方式

C.要保证“神舟六号”载人飞船成功发射,对重要零部件的检查采用抽查方式

D.要了解人们对环境的保护意识,采用抽查方式

解D.

说明当一项调查具有破坏性或以现有的人力、物力、财力很难(或没有必要)进行普查时,就选择抽查,对像“神舟六号”重要零部件的检查这类调查则必须选择普查.

例2某校对1200名女生的身高进行了测量,身高在1.58~1.63(单位:

m)这一小组的频率为0.25,则该组的人数为().

A.150人B.300个C.600人D.900人

分析1200名女生就有1200个身高,故数据总数为1200.同理,该组的人数即为落在该组的数据个数,即该组的频数.由频率=频数÷数据总数得,频数=频率×数据总数=0.25×1200=300.故该组的人数为300人.故选B.

说明对频数与频率的考查大多数放置于数据处理的背景之下,侧重于对概念的理解与运用,单独考查时一般以填空和选择的题型出现,但更多的是与统计图等结合考查.

例3我市某一周的最高气温统计如下表:

最高气温(℃)

25

26

27

28

天数

1

1

2

3

则这组数据的中位数与众数分别是().

A.27℃,28℃B.27.5℃,28℃

C.28℃,27℃D.26.5℃,27℃

分析由上表可知,一共统计了7个数据,将它们按从小到大排列为25,26,27,27,28,28,28,第4个数据是27,故这组数据的中位数是27(℃).又数据28出现的次数最多,所以众数是28(℃).故选A.

说明

(1)求中位数时,先看这组数据的个数是奇数还是偶数,然后将这组数据按从小到大的顺序排列.若有奇数个数据,则最中间那个数据就是这组数据的中位数;若有偶数个数据,则最中间两个数据的平均数即是这组数据的中位数;

(2)求众数时,先数出各数据在这组数据中出现的次数,出现次数最多的数据就是这组数据的众数.有时一组数据的众数不只一个.

例4某单位欲从内部招聘管理人员一名,对甲、乙、丙3名候选人进行了笔试和面试两项测试,3人的测试成绩如下表所示:

测试项目

测试成绩/分

笔试

75

80

90

面试

93

70

68

图19-1

根据录用程序,组织200名职工对三人利用投票推荐的方式进行民主评议,三人得票率(没有弃权票,每位职工只能推荐1人)如图19-1所示,每得一票记作1分.

(1)请算出三人的民主评议得分;

(2)如果根据三颂测试的平均成绩确定录用人选,那么谁将被录用(精确到0.01)?

(3)根据实际需要,单位将笔试、面试、民主评议三项测试得分按的4∶3∶3比例确定个人成绩,那么谁将被录用?

(1)三人民主评议的得分分别为:

甲200×25%=50(分),乙200×40%=80(分),丙200×35%=70(分).

(2)按三项平均成绩计算,甲的成绩是

(75+93+50)≈72.67,乙的成绩是

(80+70+80)≈76.67,丙的成绩是

(90+68+70)=76.00.乙的成绩最高,他将被录用.

(3)若笔试、面试、民主评议三项测试得分按4∶3∶3的比例确定,三人的成绩分别为:

丙的成绩最高,他将被录用.

说明

(1)计算加权平均数,随着权数的不同,结果可能不同.权数最大的数据对平均数的结果影响最大;

(2)在实际问题中,往往采用加权平均数算法,而很少用算术平均数的算法.

例5甲、乙两同学近期5次百米跑测试成绩的平均数相同,甲同学成绩的方差

=4,乙同学成绩的方差

=3.1,则对他们测试成绩的稳定性判断正确的是().

A.甲的成绩较稳定

B.乙的成绩较稳定

C.甲、乙成绩的稳定性相同

D.甲、乙成绩的稳定性无法比较

分析因为方差越小,波动就越小,且

,所以乙同学的成绩波动就小,即乙的成绩较稳定.故选B.

说明中考对极差、方差和标准差这三个统计量的考查,主要侧重于在实际情景中对其意义的理解,以及根据统计结果做出合理的判断和预测.

例6某校从甲、乙两名优秀选手中选择一名选手参加全市中学生田径百米比赛,该校预先对这两名选手测试了8狄,测试成绩如下表:

(单位:

s)

1

2

3

4

5

6

7

8

甲选手的成绩

12.1

12.2

13.0

12.5

13.1

12.5

12.4

12.2

乙选手的成绩

12.0

12.4

12.8

13.0

12.2

12.8

12.3

12.5

根据测试成绩,请你运用所学过的统计知识做出判断,派哪一位选手参加比赛更好?

为什么?

解通过计算,可得

=12.5,

=12.5,

=0.12,

=0.1025.

,∴两位选手的平均成绩相等.

又∵

,∴乙选手的成绩更稳定.

因此应该派乙选手去参加比赛.

说明

(1)当用求平均数的方法(包括众数和中位数)无法比较两组数据的集中趋势时,还要用方差(包括极差)进一步比较两组数据的波动情况;看谁的波动小,就说明谁更稳定.

(2)变式练习:

在一次毕业考试中,某校九年级

(1)、

(2)两班学生数学成绩统计如下表:

分数

50

60

70

80

90

100

(1)班

3

5

16

3

11

12

(2)班

2

5

11

12

13

7

请你根据所学的统计知识,分别从①平均数;②众数;③方差等不同的角度判断,综合分析这两个班中哪个班的考试成绩更加优秀.

解通过观察和计算,

九年级

(1)班:

平均数80,众数70,方差244;

九年级

(2)班:

平均数80,众数90,方差180.

从平均数看,两个班考试成绩相当,不分优劣;从众数看

(2)班成绩较好;从方差看

(2)班成绩较稳定;综上所述

(2)班成绩更加优秀.

(3)比较的角度不同,所得结论不一定相同.

三、课标下新题展示

例7某校为了解九年级学生体育测试成绩情况,以九年

(1)班学生的体育测试成绩为样本,按A,B,C,D四个等级进行统计,并将统计结果绘成如下两幅统计图(见图19-2),请你结合图中所给信息解答下列问题:

图19-2

(说明:

A级:

90分~100分;B级:

75分~89分;C级:

60分~74分;D级:

60分以下)

(1)求出D级学生的人数占全班总人数的百分比;

(2)求出扇形统计图中C级所在的扇形圆心角的度数;

(3)该班学生体育测试成绩的中位数落在哪个等级内;

(4)若该校九年级学生共有500人,请你估计这次考试中A级和B级的学生共有多少人?

(1)4%;

(2)72°;(3)B;

(4)依题意知:

A级和B级学生的人数和占全班总人数的76%,500×76%=380,所以估计这次考试中A级和B级的学生共有约380人.

例8在第49届世界乒乓球锦标赛中,男子单打决赛在我国选手马琳和王励勤之间展开.双方苦战七局,最终王励勤以4∶3获得胜利.七局比分如下表:

局数

得分

姓名

马琳

11

11

5

11

8

9

6

王励勤

9

7

11

8

11

11

11

(1)请将七局比分的相关数据的分析结果直接填入下表中(结果保留两个有效数字).

项目

分析

结果

姓名

平均分

众数

中位数

马琳

8.7

9.0

王励勤

11

(2)中央电视台在此次现场直播时,开展了“短信互动,有奖竞猜”活动,凡是参与短信互动且预测结果正确的观众,都能参加“乒乓大礼包”的抽奖活动.据不完全统计,有32320名观众参与了此次短信互动活动,其中有50%的观众预测王励勤获胜.刘敏同学参加了本次“短信互动”活动,并预测了王励勤获胜,如果从中抽取20名幸运观众,并赠送“乒乓大礼包”一份,那么刘敏同学中奖概率有多大?

(1)马琳得分的众数为11;王励勤得分的平均数为9.7,中位数为11.

(2)根据题意,预测正确的观众总数为32320×50%=16160,他们成为幸运观众的可能性相同,而幸运观众数为20,故刘敏中奖的概率为

四、课标考试达标题

(一)选择题

1.某课外兴趣小组为了解所在地区老年人的健康状况,分别作了四种不同的抽样调查.你认为抽样比较合理的是().

A.在公园调查了1000名老年人的健康状况

B.在医院调查了1000名老年人的健康状况

C.调查了10名老年邻居的健康状况

D.利用派出所的户籍网随机调查了该地区10%的老年人的健康状况

2.图19-3中,用来表示不同品种的奶牛的平均产奶量最为合适的是().

图19-3

3.某地今年1月1~4日每天的最高气温与最低气温如下表:

日期

1月1日

1月2日

1月3日

1月4日

最高

气温

5℃

4℃

0℃

4℃

最低

气温

0℃

-2℃

-4℃

-3℃

其中温差最大的是().

A.1月1日B.1月2日

C.1月3日D.1月4日

4.已知样本x1,x2,x3,x4的平均数是2,则x1+3,x2+3,x3+3,x4+3的平均数为().

A.2B.2.75C.3D.5

5.数学老师对小明参加的四次中考数学模拟考试成绩进行统计分析,判断小明的数学成绩是否稳定,因此老师需要知道小明这四次数学成绩的().

A.平均数B.众数C.中位数D.方差6.在1000个数据中,用适当的方法抽取了50个数据作为样本进行统计.频率分布表中,

在54.5~57.4这一组的频率是0.12,那么估计总体落在这一组之间的数据有().

A.120个B.60个C.12个D.6个

(二)填空题

7.在扇形统计图中,占圆12%的扇形的圆心角是______°,圆心角是144°的扇形占它所在圆的面积的______(填百分数).

8.班主任为了解学生周末在家的学习情况,家访了班内的六位学生,了解到他们在家的学习时间如下表所示.那么这六位学生学习时间的众数是______,中位数是______.

学生姓名

小丽

小明

小颖

小华

小乐

小恩

学习时间

(小时)

4

6

3

4

5

8

9.数据-2,-1,0,1,2的方差是______.

10.某生物小组11人到校外采集植物标本,其中有2人每人采集到6件,有4人每人采集到3件,有5人每人采集到4件,则这个小组平均每人采集标本______件.

(三)解答题

11.宁波港是一个多功能、综合性的现代化大港,年货物吞吐量位居中国内地第二、世界排名第五,成功跻身于国际大港行列.如图19-4是宁波港1994年至2004年货物吞吐量统计图.

图19-4

(1)从统计图中你能发现哪些信息,请说出两个;

(2)有人判定宁波港货物吞吐量每两年间的增长率都不超过30%,你认为他的说法正确吗?

请说明理由.

 

12.某校初一年级学生每人都只使用甲、乙、丙三种品牌中的一种计算器,图19-5是该年级全体学生使用3种不同品牌计算器人数的频率分布直方图.

图19-5

(1)求该校初一年级学生的总人数;

(2)你认为哪种品牌计算器的使用频率最高?

并求出这个频率.

(3)通过以上统计结果,请你给为学校供货的商家提出一条进货的合理化建议.

参考答案

第十九讲数据的收集与整理

1.D.2.D.3.D.4.D.5.D.6.A.

7.43.2,40%.8.4,4.5.9.2.10.4.

11.

(1)略;

(2)不对;比如1994年到1996年的年增长率为30.6%,超过了30%.

12.

(1)20+60+120=200(人);

(2)丙牌使用频率最高,为

=60%;

(3)多进丙牌计算器.

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > IT计算机 > 计算机软件及应用

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1