数据分析初步复习讲义汇编.docx
《数据分析初步复习讲义汇编.docx》由会员分享,可在线阅读,更多相关《数据分析初步复习讲义汇编.docx(11页珍藏版)》请在冰豆网上搜索。
数据分析初步复习讲义汇编
第三章数据分析初步
项目一知识概要
1.平均数、中位数、众数的概念及举例
一般地,对于n个数x1,x2,…,xn,我们把,叫做这n个数的算术平均数,简称平均数。
一般地,n个数据按大小顺序排列,处于的一个数据(或)叫做这组数据的中位数。
一组数据中出现次数的那个数据叫做这组数据的众数。
2.平均数、中位数、众数的特征
(1)平均数、中位数、众数都是表示一组数据“平均水平”的特征数。
(2)平均数能充分利用数据提供的信息,在生活中较为常用,但它容易受极端数字的影响,且计算较繁。
(3)中位数的计算简单,受极端数字影响较小,但不能充分利用所有数字的信息。
当一组数据中个别数据变动较大时,可选择中位数来表示这组数据的“集中趋势”。
(4)众数的可靠性较差,它不受极端数据的影响,求法简便。
当一组数据中某些数据多次重复出现时,众数是我们关心的一种统计量。
3.加权平均数
例1:
统计一名射击运动员在某次训练中15次射击的中靶环数,获得如下数据:
6,7,8,7,7,8,10,9,8,8,9,9,8,10,9,求这次训练中该运动员射击的平均成绩。
4、方差与标准差
在一组数据中,各数据与它们平均数的差的平方的平均数(即“先平均,再求差,然后平方,最后再平均”)得到的数叫方差,公式是
标准差公式是
项目二例题精讲
【例1】.为了了解学生参加体育活动的情况,学校对学生进行随机抽样调查,其中一个问题是“你平均每天参加体育活动的时间是多少?
”,共有4个选项:
A.1.5小时以上B.1~1.5小时
C.0.5—1小时D.0.5小时以下
图1、2是根据调查结果绘制的两幅不完整的统计图,请你根据统计图提供的信息,解答以下问题:
(1)本次一共调查了多少名学生?
(2)在图1中将选项B的部分补充完整;
(3)若该校有3000名学生,你估计全校可能有多少名学生平均每天参加体育活动的时间在0.5小时以下.
图1图2
【例2】:
某商场一天中售出李宁牌运动鞋16双,其中各种尺码的鞋销售如下表所示
鞋的尺码(cm)
23.5
24
24.5
25
26
销售量(双)
1
3
4
6
2
这组数据的众数和中位数各是多少?
【例3】.我市部分学生参加了2004年全国初中数学竞赛决赛,并取得优异成绩.已知竞赛成绩分数都是整数,试题满分为140分,参赛学生的成绩分数分布情况如下:
分数段
0-19
20-39
40-59
60-79
80-99
100-119
120-140
人数
0
37
68
95
56
32
12
请根据以上信息解答下列问题:
(1)全市共有多少人参加本次数学竞赛决赛?
最低分和最高分在什么分数范围?
(2)经竞赛组委会评定,竞赛成绩在60分以上(含60分)的考生均可获得不同等级的奖励,求我市参加本次竞赛决赛考生的获奖比例;
(3)决赛成绩分数的中位数落在哪个分数段内?
(4)上表还提供了其他信息,例如:
“没获奖的人数为105人”等等.请你再写出两条此表提供的信息.
【例4】:
某班甲小组有6人,数学平均成绩为80分,乙小组有8人,数学平均成绩为75分,这两个小组的平均成绩是多少?
【例5】:
求数据1,3,8,4,9,7,5的中位数。
【例6】:
某次数学测验满分100分,某班的平均成绩为75分,方差为10,若把每位同学的成绩按满分120分进行换算,则换算后的平均成绩与方差分别为()和()。
项目三冲刺必练
一、判断题
1、若一组数据的众数是5,则这组数据中出现次数最多的是5。
()
2、一组数据的平均数、众数、中位数有可能相同。
()
3、一组数据的平均数一定大于其中的每一个数据。
()
4、一组数据中处于最中间位置的一个数据,叫做这组数据的中位数。
()
5、某产品的销量占某城市同类产品销量的40%,由此可判断该产品在国内同类产品的销量占40%。
()
二、填空题
1、某班45名学生中,14岁的15人,15岁的18人,16岁的11人,17岁的1人,则这个班学生的平均年龄是岁(保留两个有效数字)。
2、一组数据1、3、6、a、b的平均数是4,则a与b的和是。
3、某公司招聘推销人员,小亮的成绩是:
形象84分,语言能力78分,应变能力88分,这三种成绩平均分是,若三种成绩依次按3:
4:
3的比例来计算,那么这三种测试的平均分是。
4、样本数据10、10、x、8的众数与平均数相同,那么这组数据的中位数是。
5、已知某次测验的最高分、最低分、平均分、中位数,同学甲要知道自己的成绩,属于班级中较高的一半还是较低的一半,应利用上述数据中的_________。
6、如果样本方差s2=
[(x1-2)2+(x2-2)2+(x3-2)2+(x4-2)2],那么这个样本的平均数为__________,样本容量为________.
三、选择题
1、若一组数据x1、x2、x3、x4、x5的平均数是a,则另一组数据x1、x2+1、x3+2、x4+3、x5+4的平均数是()
(A)a(B)a+2(C)a+5/2(D)a+10
2、当五个整数从小到大排列,其中位数为4,若这组数中的惟一众数为6,则这5个整数可能的最大和为()
(A)21(B)22(C)23(D)24
3、在共有15人参加的“讲诚信”演讲比赛中,参赛选手的成绩各不相同,因此选手要想知道自己是否进入前8名,只需要了解自己的成绩以及全部成绩的()
(A)平均数(B)中位数
(C)众数(D)以上答案都不正确
4、某校在预防“非典型肺炎”过程中,坚持每日检查体温,下表是该校八年级四班同学一天的体温数据统计表,则该班40名学生体温的中位数是()
体温
(t℃)
36.0
36.1
36.2
36.3
36.4
36.5
36.6
36.7
36.8
36.9
37.0
人数
0
2
0
5
7
5
6
3
8
3
1
(A)36.8℃(B)36.5℃(C)36.6℃(D)36.4℃
5、A、B、C、D、E五名射击运动员在一次比赛中的平均成绩是80环,而A、B、C三人的平均成绩是78环,那么下列说法中一定正确的是()
A.D、E的成绩比其他三人好
B.B、E两人的平均成绩是83环
C.最高分得主不是A、B、C
根据调查资料分析:
大学生的消费购买能力还是有限的,为此DIY手工艺品的消费不能高,这才有广阔的市场。
D.D、E中至少有1人的成绩不少于83环。
成功秘诀:
好市口+个性经营6、如果a、b、c的中位数与众数都是5,平均数是4,那么a可能是()
现在是个飞速发展的时代,与时俱进的大学生当然也不会闲着,在装扮上也不俱一格,那么对作为必备道具的饰品多样性的要求也就可想而知了。
A.2B.3C.4D.6
(2)文化优势7、由小到大排列一组数据a1、a2、a3、a4、a5,其中每个数据都小于0,则对于样本a1、a2、-a3、-a4、-a5、0的中位数可表示为()
营销环境信息收集索引A.
B.
C.
D.
8、下列说法中正确的有()
2、消费者分析
(1)描述一组数据的平均数只有一个;
(二)大学生对DIY手工艺品消费态度分析
(2)描述一组数据的中位数只有一个;
但这些困难并非能够否定我们创业项目的可行性。
盖茨是由一个普通退学学生变成了世界首富,李嘉诚是由一个穷人变成了华人富豪第一人,他们的成功表述一个简单的道理:
如果你有能力,你可以从身无分文变成超级富豪;如果你无能,你也可以从超级富豪变成穷光蛋。
(3)描述一组数据的众数只有一个;
(4)描述一组数据的平均数,中位数,众数都一定是这组数据里的数;
(一)上海的经济环境对饰品消费的影响(5)一组数据中的一个数大小发生了变化,一定会影响这组数据的平均数,众数,中
位数。
A.1个B.2个C.3个D.4个
创业首先要有“风险意识”,要能承受住风险和失败。
还要有责任感,要对公司、员工、投资者负责。
务实精神也必不可少,必须踏实做事;9、一城市准备选购一千株高度大约为2m的某种风景树来进行街道绿化,有四个苗圃生产基地投标(单株树的价格都一样).采购小组从四个苗圃中都任意抽查了20株树苗的高度,得到的数据如下:
树苗平均高度(单位:
m)
标准差
甲苗圃
1.8
0.2
乙苗圃
1.8
0.6
丙苗圃
2.0
0.6
丁苗圃
2.0
0.2
请你帮采购小组出谋划策,应选购( ).
A.甲苗圃的树苗B.乙苗圃的树苗
C.丙苗圃的树苗D.丁苗圃的树苗
10、衡量样本和总体的波动大小的特征数是( ).
A.平均数B.方差
C.众数D.中位数
四、解答题
1.已知两组数x1,x2…xn和y1,y2…yn;它们的平均数分别是
和
。
分别求下列各组新数据的平均数:
(1)5x1,5x2,…,5xn;
(2)x1-y1,x2-y2,…,xn-yn;
(3)x1,y1,x2,y2,…,xn,yn。
2.某商厦在“十一长假期间”平均每天的营业额为20万元,由此推断10月份该商厦的总营业额约为20×30=620(万元)。
根据你所学的数理统计知识,你认为这样的推断是否合理?
为什么?
3.右图是某班学生某次英语考试成绩分析图,其中纵轴表示学生数,横轴表示分数,观察图形填空或回答下列问题。
(1)全班共有人_______;
(2)如果80分以上的成绩算优良,那么该班学生此次英语考试成绩的优良率为______;
(3)请估算该班此次考试的平均成绩。
度数(度)
90
93
102
113
114
120
天数(天)
1
1
2
3
1
2
4.某中学为了了解全校的耗电情况,抽查了10天中每天的耗电量数据如下表
(1)写出上表中数据的众数和平均数;
(2)由上题获得的数据,估计该校一个月的耗电量(按30天计算);
(3)若当地每度电的价格是0.5元,写出该校应付电费y(元)与天数x(x取正数,单位:
天)之间的函数关系式。
5、汶川地震牵动着全国亿万人民的心,某校为地震灾区开展了“献出我们的爱”赈灾捐款活动。
八年级
(1)班50名同学积极参加,班长统计了全班捐款情况如下表,因不慎有两处被墨水污染,已无法看清。
但知全班平均每人捐款38元,根据以上信息,请你求出捐款40元,50元的学生人数,并写出解答过程;
6、在某旅游景区上山的一条小路上,有一些断断续续的台阶,下图是其中的甲、乙两段台阶的示意图(图中的数字表示每一级台阶的高度(单位:
cm).并且数据15,16,16,14,14,15的方差
,数据11,15,18,17,10,19的方差
)
。
请你用所学过的有关统计的知识(平均数、中位数、方差和极差)回答下列问题:
(1)两段台阶路有哪些相同点和不同点?
(2)哪段台阶路走起来更舒服?
为什么?
(3)为方便游客行走,需要重新整修上山的小路.对于这两段台阶路,在台阶数不变的情况下,请提出合理的整修建议.