数据的收集与整理.docx
《数据的收集与整理.docx》由会员分享,可在线阅读,更多相关《数据的收集与整理.docx(19页珍藏版)》请在冰豆网上搜索。
数据的收集与整理
第四章数据的收集与整理
4.1喜爱哪种动物的同学最多
——全面调查举例
课前导读
1.收集数据有哪些方式?
2.整理数据我们一般用什么方式?
3.班上要选举三好生,一般采取划“正”字的方法,怎么做的?
请与你的同伴交流。
4.描述数据有哪些方式?
课中导学
1.全面调查是指_______________________________________________.
2.设计一个方案,了解你班同学的视力情况。
〔1〕图中的树高表示什么?
从图中能获得哪些些信息?
〔2〕各年份约种树多少万亩?
〔3〕假设每人每年平均植树10亩,在各时间段需要多少人?
【解析】〔1〕树高表示植树亩数,从图上看,植树面积一年比一年多,说明国家征服沙漠的决心很大;〔2〕2002年种树约50万亩,2003年种树约75万亩,2004年种树约100万亩,2005年种树约150万亩,2006年种树约200万亩;〔3〕2002年需5万人,2003年需7.5万人,2004年需10万人,2005年需15万人,2006年需20万人,
课后导练
1.整理数据用表格,描述统计数据可用_____图和_____图来直观表示。
2.国家人口普查是_______调查,即调查对象包括全国人口。
3.根据下表,答复以下问题。
动物名称
鸡
鸭
鹅
鸽子
火鸡
孵化时间
21天
30天
30天
16天
26天
〔1〕孵化期最短是_________天,是___________动物;
〔2〕孵化期最长是_________天,是___________动物。
4.数学兴趣学习小组对本校七年级全校学生每天到校方式进行了一次调查,调查的数据如下表:
步行
骑自行车
坐公共汽车
其它方式
50人
100人
140人
10人
〔1〕这个学校七年级有__________名学生;
〔2〕采用_____________到校方式的人最多,有______人;
〔3〕采用_____________到校方式的人最少,有______人;
〔4〕采用_____________到校方式的人数是采用__________到校方式的人数的两倍。
〔5〕调查一下你所在班级所有同学每天到校方式,并制作一个统计表整理你的数据。
5.下表是对四位小朋友每天回家看课外书的时间的调查
小明
小亮
小华
小花
时间〔分钟〕
30
10
8
5
从这张表中你能获得哪些信息?
与你的同伴交流。
6.某市教育局为了了解本市中小学实施素质教育的情况,抽查了某校七年级甲、乙两个班的部分学生,了解他们在一周内〔星期一至星期五〕参加课外活动的次数情况,抽查结果统计如下:
〔1〕在这次抽查中,甲班被抽查了______人,乙班被抽查了_______人;
〔2〕在被抽查的学生中,甲班学生参加课外活动的平均次数为_______次,
乙班学生参加课外活动的平均次数为_______次。
〔3〕从图中你还能得到哪些信息?
7.小华调查了七〔2〕班50名同学最喜欢的足球明星,结果如下:
BBCAABCDCB
CADDBACCBA
ABDACCABAC
ABCDACCACA
AAACBCCAAD
其中A代表贝克汉姆,B代表欧文,C代表罗纳尔多,D代表巴乔。
〔1〕填写下表
足球明星
划记
人数
百分比
A
B
C
D
合计
〔2〕该班同学最喜欢哪位明星?
8.为了调查居民的生活水平,有关部门对某居委会的50户居民的家庭存款额进行了调查,数据〔单位:
万元〕如下:
〔1〕这50个家庭存款额的最大值、最小值分别是多少?
它们相差多少?
〔2〕填表:
存款额x〔万元〕
划记
户数
≤
≤
≤
≤
≤
≤
≤
〔3〕根据上表谈谈这50户家庭存款额的分布情况。
课外导思
9.设计一个调查问卷,调查你班同学喜欢哪一部动画片,并用适当的表格整理数据,看看有什么结论。
请与你的同伴交流。
读一读
“统计”一词的产生
统计已经有几千年的历史。
不过在早期还没有出现“统计”这样的用语。
统计语源最早出现于中世界拉丁语的Status,意思指各种现象的状态和状况。
由这一语根组成意大利语Stato,表示"国家"的概念,也含有国家结构和国情知识的意思。
根据这一语根,最早作为学名使用的“统计”,是在十八世纪德国政治学教授亨瓦尔〔G.Achenwall) 在1749年所著《近代欧洲各国国家学纲要》一书绪言中,把国家学名定为“Statistika”〔统计〕这个词。
原意是指“国家显著事项的比较和记述”或“国势学”,认为统计是关于国家应注意事项的学问。
此后,各国相继沿用“统计”这个词,并把这个词译成各国的文字,法国译为Statistique,意大利译为Statistica,英国译为Statistics,日本最初译为“政表”、“政算”、“国势”、“形势”等,直到1880年在太政官中设立了统计院,才确定以“统计”二字正名。
1903年〔清光绪廿九年〕由钮永建、林卓南等翻译了四本横山雅南所著的《统计讲义录》一书,把“统计”这个词从日本传到我国。
1907年〔清光绪卅三年〕彭祖植编写的《统计学》在日本出版,同时在国内发行,这是我国最早的一本“统计学”书籍。
“统计”一词就成了记述国家和社会状况的数量关系的总称。
4.2调查中小学生的视力情况
——抽样调查举例
课前导读
1.某地区要对中小学生的视力情况,请你设计一个调查方案,并与你的同伴交流。
2.要找出保护视力的措施,在设计调查问卷时应考虑调查哪些问题?
3.统计调查是收集数据常用的方法,一般有哪两种调查方式?
课中导学
1.你能区别总体、个体、样本吗?
2.抽样调查是指。
3.举例说明在什么情况下用全面调查较好?
4.举例说明在什么情况下用抽样调查较好?
【精典例题】
例1.为了解某市在校学生的身体营养状况,可通过抽取学生的血样进行血色素检测,现随机抽取该市七年级8000名学生进行血色素检测,以此来估计该市在校学生的营养状况,你认为这种调查是否可行?
请说明理由,如果要准确反映该市学生的身体营养状况,你认为应该怎样调查更合理一些?
【解析】本例主要考查抽样不同会对结果产生影响。
仅有七年级学生的身体情况不足以反映全市学生的身体状况。
因为各年龄层次的学生、城区与农村的学生生活状况是不同的。
解:
从该市随机抽取七年级8000名学生进行血色素检测,只能反映该市七年级学生的营养状况,不足以反映全市学生的身体状况的。
原因是各年龄层次的学生、城区与农村的学生生活状况是不同的。
为了准确反映该市所有学生的身体营养状况,应从各个年级、不同地区随机抽取部分学生,用他们的身体营养状况可反映全映学生的身体营养状况。
说明本例说明抽样调查时应注意样本的代表性和广泛性,不能以偏概全而出现抽样的不合理性。
例2.某专业户要出售100只羊,现在市场上羊的价格为每千克11元,为了估计这100只羊能卖多少钱,该专业户从中随机抽取5只羊,每只羊的重量如下(单位:
千克):
2631323637
⑴试分别指出上述问题中的总体、个体和样本各是什么?
⑵上述问题中的调查方式是全面调查好还是抽样调查好,请说明你的理由;
⑶估计这100只羊每只羊的平均重量;
⑷估计这100只羊能卖多少钱?
【解析】在⑶中可用样本平均数估计出总体平均数;⑷中问题便迎刃而解。
解:
⑴在上述问题中的总体是100羊的重量;个体是一只羊的重量;样本是所抽取的5只羊的重量;
⑵在上述问题中的调查方式宜采用抽样调查方式为好。
由于羊的头数太多,不宜采用全面调查方式去调查。
⑶样本平均数为
((千克),故可以估计这100只羊每只羊的平均重量为32.4千克。
⑷×100×11=35640〔元〕,这100只羊能卖35640元。
课后导练
1.以下调查适合作抽样调查的有〔〕
〔1〕了解全班同学期末考试的数学成绩〔2〕了解夏季冷饮市场上冰淇淋的质量情况〔3〕了解中学生吸烟状况〔4〕了解一片森林里有多少只野兔〔5〕调查全校学生对学校预防“非典”所采取措施的看法。
〔A〕1个〔B〕2个〔C〕3个〔D〕4个
2.一名交警在高速公路上随机观察了6辆车的车速,然后他给出了一份报告,调查结果如下表:
车序号
1
2
3
4
5
6
车速(千米/时)
56
66
73
58
69
58
⑴交警采用的是__________调查方式;
⑵这个调查的样本是_________________,个体是___________________。
3.我国2003年上半年每日公布非典疫情,其中有关数据的收集所采用的调查方式是_______。
4.某省有7万名学生参加初中毕业会考,要想了解这7万名学生的数学成绩,从中抽取了1000名考生的数学成绩进行统计分析,以下说法正确的选项是〔 〕
〔A〕这1000名考生是总体的一个样本
〔B〕每位考生的数学成绩是个体
〔C〕7万名考生是总体
〔D〕这种调查是抽样调查
5.为增强市民的环保意识,配合6月5日的“世界环境日”活动,某校七年级50名学生在一天调查了各自家庭丢弃废塑料袋的情况,这个问题中50名学生各自家庭一天丢弃废塑料袋的情况是〔 〕
〔A〕总体〔B〕样本〔C〕个体〔D〕样本的数目
6.当今,青少年视力水平的下降已引起全社会的关注。
为了解某中学毕业年级500名学生的视力情况,从中抽测了80名学生的视力,在这个问题中,总体、个体、样本各指什么?
上述问题采用全面调查还是抽样调查?
7.《三国演义》是我国最经典的名著之一。
为了解我国阅读过《三国演义》的读者,你认为采用什么方式调查更合适些,你认为对不同地区、不同年龄、不同文化背景的人所作的调查结果会一样吗?
8.某瓜农采用大棚栽培技术种植了一亩地的良种西瓜,这亩地产西瓜约800个,在西瓜上市前该瓜农随机摘下了10个成熟的西瓜,称重如下:
西瓜质量〔单位:
千克〕
西瓜数量〔单位:
个〕
1
2
3
2
1
1
(1)在这个问题中,总体、个体、样本各指什么?
(2)在这个样本中,平均数是多少?
(3)试估计这亩地的西瓜产量约是多少千克。
课外导思
9.“在一次考试中,考生有4万多名,如果为了得到这些考生的数学平均成绩而将他们的成绩全部相加再除以所有考生总数,那将是十分麻烦的。
那么怎样才能了解这些考生的数学平均成绩呢?
”
“通常在考生很多的情况下,我们是从中抽取部分考生〔比方说500名〕的成绩,用他们的平均成绩去估计所有考生的平均成绩。
”
上述文字表述了用样本平均数估计总体平均数的统计思想,其中总体指的是,
个体指的是。
用你用简洁的语言举一个在实际生活中运用同样思想解决问题的例子,同样写出其中的总体、个体和样本各是什么?
并说一说要想了解总体的情况采用哪种调查方式较好?
读一读
大样本一定能保证调查结论准确吗
仅仅调查了100位老年人的健康的状况,能据此推断我国所有老年人的健康状况吗?
不能,因为样本太小了。
那么,大样本就能保证调查结论准确吗?
1936年,美国《文学文摘》杂志根据1000万户和从该杂志订户所收回的意见,断言兰登将以370:
161的优势在总统选举中击败罗斯福。
但结果是,罗斯福当选了,《文学文摘》大丢面子,原因何在呢?
原来,1936年能装或订阅《文学文摘》杂志的人,在经济上都相对富裕,而收入不太高的大多数选民选择了罗斯福。
《文学文摘》的教训说明,抽样调查时,既要关注样本的大小,又要关注样本的代表性。
本章测试题
一、选择题〔每题4分,共28分〕
1.实验中学七年级进行了一次数学测验,参考人数共480人,为了解这次数学测验成绩,以下所抽取的样本中较为合理的是〔〕
〔A〕抽取前100名同学的数学成绩
〔B〕抽取后100名同学的数学成绩
〔C〕抽取〔1〕、〔2〕两班同学的数学成绩
〔D〕抽取各班学号为3号的倍数的同学的数学成绩
2.为了了解某县30~50岁成人的健康状况,采取了抽样调查方式获得结果。
下面所采取的抽样合理的是〔〕
〔A〕抽查了该县30~50岁的男性公民
〔B〕抽查了该县城区30~50岁的成人
〔C〕随机抽查了该县所有30~50岁成人共400名
〔D〕抽查了该县的所有30~50岁的工人
3.以下说法正确的选项是〔〕
〔A〕只有通过全面调查才能获取总体的特征
〔B〕抽样调查是获取数据的唯一途径
〔C〕全面调查比抽样调查方便得多
〔D〕抽样调查时的样本应具有随机性
4.某市教育局今年体育测试中,从某校毕业班中抽取男、女学生各15人进行三项体育成绩复查测试.在这个问题中,以下表达正确的选项是()
〔A〕该校所有毕业班学生是总体〔B〕所抽取的30名学生是样本
〔C〕样本的数目是15〔D〕个体指的是毕业班每一个学生的体育测试成绩
5.如下图,分别是我国1997年~2000年全国初中生在校人数和全国初中学校数的统计图:
由上图可知,1997年~2000年,我国初中生在校人数〔〕
A.逐年增加,学校数也逐年增加
B.逐年增加,学校数却逐年减少
C.逐年减少,学校数也逐年减少
D.逐年减少,学校数却逐年增加
6.以下调查适合作抽样调查的有〔〕
〔1〕了解夏季冷饮市场上冰淇淋的质量情况;〔2〕了解全班同学期末考试的数学成绩;〔3〕了解中学生吸烟状况;〔4〕了解一片森林里有多少只野鸡;〔5〕检测某城市的空气质量。
A.1个B.2个C.3个D.4个
7.为了解某城市老年人的健康状况,你可采取以下〔〕方法去收集数据。
〔1〕问卷调查;〔2〕访问调查;〔3〕查阅资料;〔4〕关心老年人
A.1种B.2种C.3种D.4种
二、填空题〔每题4分,共20分〕
8.要了解你班同学的每周平均上网时间,你所采取的调查方式可以是。
9.近几年,人们的环保意识逐渐增加,“白色污染”现象越来越受到人们的重视.小亮同学想了解班上同学家里在一年内丢弃废塑料袋的个数,你认为可采用调查方式合适一些.
10.某班假设干名女生身高检测结果如下表(单位:
米)
身高
人数
2
2
3
3
8
7
3
2
则该班女生有________人,身高最高是_______米。
11.甲、乙两人参加某体育项目训练五次测试成绩得分如下表:
次数
第一次
第二次
第三次
第四次
第五次
甲
20
23
22
24
26
乙
23
24
22
22
24
〔1〕第_______次甲、乙两人的得分相差最大,相差______分;
〔2〕第_______次甲、乙两人的得分相同,都是______分
12.美化城市,改善人们的居住环境已成为城市建设的一项重要内容。
某市城区近几年来,通过各种措施,使城市绿地面积不断增加,如以下图所示。
根据图中所提供的信息,可知2003年底的绿地面积为_________公顷,比2002年增加了_______公顷,在2001年、2002年、2003年这三年中,绿地面积增加最多的一年是_________.
三、解答题〔共52分〕
13.〔此题总分值8分〕天津及杭州两城市月降水量统计表〔单位:
〕
城市
一月
二月
三月
四月
五月
六月
七
月
八
月
九
月
十月
十一月
十二月
天津
杭州
30
287
58
297
90
482
265
677
287
855
707
960
1755
1592
1820
1830
489
1234
177
946
60
600
63
588
根据上表,答复以下问题:
〔1〕哪个城市一年的降水量大?
哪个城市的降水量幅度大?
〔2〕两城市在哪个月的降水量相差最大?
差是多少?
〔3〕哪几个月两城市的降水量相差在30毫米之内?
14.〔此题总分值8分〕华山鞋厂为了解初中学生穿鞋的鞋号情况,对永红中学七年级的20名男生所穿鞋号统计如下:
23.523.52424.52525.5262524.524
2424.525252624.5252425.525
〔1〕填写下表
鞋号
24
25
26
人数
〔2〕根据表中的的信息,你能给该鞋厂有何建议?
15.(此题总分值8分〕光华中学为了解本校中学生的身体发育状况,对某年级同龄的40名女学生的身高进行了测量,结果如下(数据均为整数,单位:
厘米):
167,154,159,166,169,159,156,162,158,159,
160,164,160,157,161,158,153,158,164,158,
163,158,160,157,162,159,165,157,151,146,
151,160,165,158,163,162,154,149,168,164
请你填写下表:
分组
划记
人数
~
~
~
~
~
合计
16.〔此题总分值8分〕下面是小明一天时间安排的统计图:
〔单位:
小时〕
〔1〕小明一天时间安排中,哪方面的安排所花时间最多?
是多少?
〔2〕他一天时间安排中,哪方面的安排所花时间最少?
是多少?
〔3〕制作一张表格,表示小明一天的作息时间安排
17.〔此题总分值10分〕为制定本市初中七、八、九年级学生校服的生产计划,有关部门准备对180名初中男生的身高作调查,现有三种调查方案:
A.测量少年体校中180名男子篮球、排球队员的身高
B.查阅有关外地180名男生身高的统计资料
C.在本市的市区和郊县各任选三所初级中学,在这六所学校有关年级的一个班中,由抽签的方法分别选出10名男生,然后测量他们的身高
(1)为了到达估计本市初中这三个年级男生身高分布的目的,你认为采用上述哪一种调查方案比较合理,为什么?
(答案分别填在空格内)
答:
选,理由:
。
(2)下表中的数据是使用了某种调查方法获得的:
初中男生身高情况抽样调查表
七年级
八年级
九年级
总计
143~153
12
3
0
153~163
18
9
6
163~173
24
33
39
173~183
6
15
12
183~193
0
0
3
1填写表中的空格;
2被调查的七年级、八年级、九年级各有多少名学生?
3请你为生产计划提出建议。
18.〔此题总分值10分〕以下图是小华作的一周的零用钱的统计图〔单位:
元〕
分析上图,请答复以下问题:
〔1〕周几小华用的零用钱最多,是多少?
他零用钱花得最少的一天是多少元?
〔2〕哪几天他花的零用钱是一样的?
分别是多少?
〔3〕你能帮小华算一算一周平均每天用多少零用钱吗?
〔4〕估计一下,小华一月用去多少零用钱?
〔一个月按30天计算〕
读一读
农村住户调查简介
国家统计局对农民收入的统计是通过“农村住户调查”来完成的。
“农村住户调查”是通过对农村居民家庭的生产、收入、消费、积累和社会活动的调查,全面反映农村居民的收入和生活质量的变化,对农村居民实现小康和摆脱贫困的进程进行监测,为各级政府制定农村政策和决策提供依据,也为国民经济核算提供了基础数据。
国际上开展“住户调查”已有很长的历史,我国农村开展住户调查始于1954年,在1954年至1977年间,该调查曾因“人民公社化”运动和“文化大革命”运动两次中断,1977年该调查再次恢复。
1984年国家统计局农村社会经济调查队成立以后,农村住户调查获得了长足发展,调查方法、调查内容逐渐与国际接轨,走上了科学化、标准化和现代化的道路。
“农村住户调查”采用的是抽样调查方法,在全国共抽取了6.8万个农户的作为调查样本,样本分布在全国31个省〔区、市〕的857个县中。
这套样本对全国和分省的农民收入水平具有很高的代表性,但是,由于经费和人员的限制,这套样本还不能满足地级以下代表性的要求。
因此,调查结果仅能反映全国和分省的情况。
经过多年的实践,“农村住户调查”逐步完善,现已形成一套完整、科学的方法体系和严格的管理制度。
1.调查组织。
农村住户调查方案由国家统计局统一制订,各地按照统一方案的要求贯彻执行,省、县农调队负责组织当地的调查工作。
为保证调查顺利开展,全国约有8000名专职调查员和近10000名辅助调查员参与这项调查工作。
2.网点抽选。
实行国家统一方案、统一审批、统一管理的原则。
网点抽选方案和实施细则由国家统计局统一制发,并由农调总队负责组织实施;各省农调队根据统一方案和实施细则制订本省的实施细则,在得到农调总队批准后负责具体实施;网点的变动和更新必须由国家统计局批准。
现行农村住户调查网点的抽选方法是简单随机抽样、分层随机抽样,有关标志排队对称等距随机抽样和三相二阶段随机抽样的综合运用。
首先以省为总体,国家调查县所辖行政村编制抽样框,抽选调查村;然后在抽选出的调查村中抽选调查户,抽选调查户的方法是,首先收集全村每个住户的人均纯收入和每户的常住人口,然后按人均纯收入的高低将所有户顺序排队,编制抽样框,用对称等距的方法抽选出调查户。
3.调查资料采集。
现行方法采用的是农户记帐与一次性调查相结合的方法,反映农户现金收支和实物收支的资料通过农户记帐获得,其他有关农户的基本情况、劳动力就业情况等采取一次性调查的方式获得。
调查户记帐按照国家统计局统一编制的帐本和要求来记帐。
现金收支帐每日一记,实物收支发生一笔记一笔。
县级农调队每月收取调查户的帐本,录入到电脑中。
一次性调查由县级农调队的调查员完成,采取入户面访的调查方式。
4.调查资料审核。
为确保调查数据的质量,对调查数据的审核有一套严格的制度规定。
在现场调查结束后,要求采取三种方法对调查资料进行一是人工审核。
在调查数据录入电脑之前,辅助调查员和县农调队必须对农户所记的帐和一次性调查表进行核查。
二是电脑审核。
在人工审核完成后,由县农调队将数据录入电脑中,应用统一的程序对数据进行审核。
三是数据评估。
县农调队将调查数据录入审核完成后将调查数据上报省农调队,省农调队再次对数据进行审核,并重点地对调查数据评估。
5.调查资料汇总。
对调查资料的汇总实行国家级超级汇总。
全国统一使用由农调总队专门开发的电脑数据处理程序,各地将审核后调查原始数据上报农调总队,由农调总队负责对各地上报的调查数据进行汇总,并将汇总结果反馈给各省,同时各地也对本地区的调查数据进行汇总,以便相互监督。
6.调查结果发布。
调查结果的发布实行国家统一管理,国家级统计结果由国家统计局发布,各省统计结果由各省统计局发布。
但是,各省发布统计结果之前,必须经国家统计局审批认定后才能发布,以确保各省发布的统计结果与超级汇总的结果一致。