专题61 统计问题中的决策问题归纳.docx
《专题61 统计问题中的决策问题归纳.docx》由会员分享,可在线阅读,更多相关《专题61 统计问题中的决策问题归纳.docx(42页珍藏版)》请在冰豆网上搜索。
专题61统计问题中的决策问题归纳
第一类回归分析中的“决策”
1.共享单车是指企业在校园、地铁站点、公共站点、居民区、商业区、公共服务区等提供自行车单车共享服务,是一种分时租赁模式,是共享经济的一种新形态.某共享单车企业在城市就“一天中一辆单车的平均成本与租用单车数量之间的关系”进行了调查,并将相关数据统计如下表:
租用单车数量(千辆)
2
3
4
5
8
每天一辆车平均成本(元)
3.2
2.4
2
1.9
1.5
根据以上数据,研究人员设计了两种不同的回归分析模型,得到两个拟合函数:
模型甲:
,模型乙:
.
(1)为了评价两种模型的拟合效果,完成以下任务:
①完成下表(计算结果精确到0.1元)(备注:
,称为相应于点的残差);
租用单车数量(千辆)
2
3
4
5
8
每天一辆车平均成本(元)
3.2
2.4
2
1.9
1.5
模型甲
估计值
2.4
2
1.8
1.4
残差
0
0
0.1
0.1
模型乙
估计值
2.3
2
1.9
残差
0.1
0
0
②分别计算模型甲与模型乙的残差平方和及,并通过比较,的大小,判断哪个模型拟合效果更好.
(2)这家企业在城市投放共享单车后,受到广大市民的热烈欢迎并供不应求,于是该企业决定增加单车投放量.根据市场调查,市场投放量达到1万辆时,平均每辆单车一天能收入7.2元;市场投放量达到1.2万辆时,平均每辆单车一天能收入6.8元.若按
(1)中拟合效果较好的模型计算一天中一辆单车的平均成本,问该企业投放量选择1万辆还是1.2万辆能获得更多利润?
请说明理由.(利润=收入-成本)
【答案】
(1)见解析;
(2)选择投放1.2万辆能获得更多利润.
【解析】试题分析:
(1)①通过计算填写表中数据即可;②计算模型甲、乙的残差平方,比较即可得出结论;
(2)计算该城市投放共享单车为1万辆和1.2万辆时,该公司一天获得的总利润是多少,比较得出结论.
试题解析:
(1)①经计算,可得下表:
2.【2018届云南省师范大学附属中学高三第七次月考】2017年12月29日各大影院同时上映四部电影,下表是2018年I月4日这四部电影的猫眼评分x(分).和上座率y(%)的数据.
利用最小二乘法得到回归直线方程:
(四舍五人保留整数)
(I)请根据数据画残差图;(结果四舍五人保留整数)()
(II)根据(I)中得到的残差,求这个回归方程的拟合优度R2,并解释其意义.
()(结果保留两位小数)
【答案】
(1)见解析
(2)0.36,猫眼评分解释了36%的上座率
【解析】试题分析:
(Ⅰ)根据表格数据利用求得残差,进而画图即可;
(Ⅱ)利用求解,说明猫眼评分解释了36%的上座率.
(Ⅱ),
猫眼评分解释了36%的上座率.
3.某印刷厂为了研究单册书籍的成本(单位:
元)与印刷册数(单位:
千册)之间的关系,在印制某种书籍时进行了统计,相关数据见下表:
根据以上数据,技术人员分别借助甲、乙两种不同的回归模型,得到两个回归方程,方程甲:
,方程乙:
.
(1)为了评价两种模型的拟合效果,完成以下任务.
①完成下表(计算结果精确到0.1);
②分别计算模型甲与模型乙的残差平方和及,并通过比较的大小,判断哪个模型拟合效果更好.
(2)该书上市之后,受到广大读者热烈欢迎,不久便全部售罄,于是印刷厂决定进行二次印刷,根据市场调查,新需求量为10千册,若印刷厂以每册5元的价格将书籍出售给订货商,求印刷厂二次印刷10千册获得的利润?
(按
(1)中拟合效果较好的模型计算印刷单册书的成本).
【答案】
(1)①.答案见解析;②.答案见解析;
(2)33360元.
【解析】试题分析:
(1)(i)计算对应的数值,填表即可;
(ii)计算模型甲、模型乙的残差平方和,比较即可得出结论;
(2)计算二次印刷时的成本,求出对应利润值即可.
试题解析:
(1)经计算,可得下表:
4.在2017年初的时候,国家政府工作报告明确提出,2017年要坚决打好蓝天保卫战,加快解决燃煤污染问题,全面实施散煤综合治理.实施煤改电工程后,某县城的近六个月的月用煤量逐渐减少,6月至11月的用煤量如下表所示:
(1)由于某些原因,中一个数据丢失,但根据6至9月份的数据得出少样本平均值是3.5,求出丢失的数据;
(2)请根据6至9月份的数据,求出关于的线性回归方程;
(3)现在用
(2)中得到的线性回归方程中得到的估计数据与10月11月的实际数据的误差来判断该地区的改造项目是否达到预期,若误差均不超过0.3,则认为该地区的改造已经达到预期,否则认为改造未达预期,请判断该地区的煤改电项目是否达预期?
(参考公式:
线性回归方程,其中)
【答案】
(1)4;
(2);(3)该地区的煤改电项目已经达到预期
【解析】试题分析:
(1)设丢失的数据为,则,即可得到丢失的数据;
(2)用最小二乘法求出关于的线性回归方程;(3)当时,当时,,所以,该地区的煤改电项目已经达到预期.
(3)当时,
同样,当时,
所以,该地区的煤改电项目已经达到预期.
5.某地区某农产品近几年的产量统计如下表:
(1)根据表中数据,建立关于的线性回归方程;
(2)若近几年该农产品每千克的价格(单位:
元)与年产量满足的函数关系式为,且每年该农产品都能售完.
①根据
(1)中所建立的回归方程预测该地区年该农产品的产量;
②当为何值时,销售额最大?
附:
对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为:
,.
【答案】
(1)
(2)①7.56②
【解析】试题分析:
(1)将数据代入回归直线方程计算公式,可求得回归直线方程.
(2)①将代入
(1)所求得方程,可求得对应的预测值.②求得销售额的表达式为,利用二次函数对称轴可求得其最大值.
(2)①由
(1)知,当时,,
即2018年该农产品的产量为7.56万吨.
②当年产量为时,销售额(万元),
当时,函数取得最大值,又因,
计算得当,即时,即2018年销售额最大.
6.某基地蔬菜大棚采用水培、无土栽培方式种植各类蔬菜.过去50周的资料显示,该地周光照量(小时)都在30小时以上,其中不足50小时的周数有5周,不低于50小时且不超过70小时的周数有35周,超过70小时的周数有10周.根据统计,该基地的西红柿增加量(百斤)与使用某种液体肥料(千克)之间对应数据为如图所示的折线图.
(1)依据数据的折线图,是否可用线性回归模型拟合与的关系?
请计算相关系数并加以说明(精确到0.01).(若,则线性相关程度很高,可用线性回归模型拟合)
(2)蔬菜大棚对光照要求较大,某光照控制仪商家为该基地提供了部分光照控制仪,但每周光照控制仪最多可运行台数受周光照量限制,并有如下关系:
周光照量(单位:
小时)
光照控制仪最多可运行台数
3
2
1
若某台光照控制仪运行,则该台光照控制仪周利润为3000元;若某台光照控制仪未运行,则该台光照控制仪周亏损1000元.若商家安装了3台光照控制仪,求商家在过去50周周总利润的平均值.
附:
相关系数公式,参考数据,.
【答案】
(1)可用线性回归模型拟合与的关系
(2)商家在过去50周周总利润的平均值为4600元
试题解析:
(1)由已知数据可得.
因为
.
所以相关系数.
因为,所以可用线性回归模型拟合与的关系.
故的分布列为
2000
6000
0.2
0.8
所以元.
③安装3台光照控制仪的情形:
当X>70时,只有1台光照控制仪运行,此时周总利润Y=1×3000-2×1000=1000元,
当50≤X≤70时,有2台光照控制仪运行,此时周总利润Y=2×3000-1×1000=5000元,
当30故的分布列为
1000
5000
9000
0.2
0.7
0.1
所以元.
综上可知,为使商家周总利润的均值达到最大应该安装2台光照控制仪.
7.某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费(单位:
万元)对年销售量(单位:
吨)和年利润(单位:
万元)的影响。
对近六年的年宣传费和年销售量的数据作了初步统计,得到如下数据:
年份
2011
2012
2013
2014
2015
2016
年宣传费(万元)
38
48
58
68
78
88
年销售量(吨)
16.8
18.8
20.7
22.4
24.0
25.5
经电脑模拟,发现年宣传费(万元)与年销售量(吨)之间近似满足关系式即。
对上述数据作了初步处理,得到相关的值如下表:
75.3
24.6
18.3
101.4
(1)根据所给数据,求关于的回归方程;
(2)规定当产品的年销售量(吨)与年宣传费(万元)的比值在区间内时认为该年效益良好。
现从这6年中任选3年,记其中选到效益良好年的数量为,试求随机变量的分布列和期望。
(其中为自然对数的底数,)
附:
对于一组数据,其回归直线中的斜率和截距的最小二乘估计分别为
【答案】
(1);
(2)见解析.
得,故所求回归方程为。
(2)先借助题设条件,于是求出,即6年中有三年是“效益良好年”,求得,,从而求出分布列和数学期望。
(2)由,于是,即6年中有三年是“效益良好年”,,由题得,
所以的分布列如表所示,且。
8.(2017·全国卷Ⅰ)为了监控某种零件的一条生产线的生产过程,检验员每隔30min从该生产线上随机抽取一个零件,并测量其尺寸(单位:
cm).下面是检验员在一天内依次抽的16个零件的尺寸:
抽取次序
1
2
3
4
5
6
7
8
零件尺寸
9.95
10.12
9.96
9.96
10.01
9.92
9.98
10.04
抽取次序
9
10
11
12
13
14
15
16
零件尺寸
10.26
9.91
10.13
10.02
9.22
10.04
10.05
9.95
经计算得:
,,
,,其中为抽取得第个零件得尺寸,.
(1)求()的相关系数,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小).
(2)一天内抽检零件中,如果出现了尺寸在之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.
(ⅰ)从这一天抽检的结果看,是否需对当天的生产过程进行检查?
(ⅱ)在之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差.(精确到0.01)
附:
样本()的相关系数,
【答案】
(1)可以认为
(2)(ⅰ)需要(ⅱ)均值的估计值为10.02,标准差的估计值为.
【解析】试题分析:
(1)依公式求;
(2)(i)由,得抽取的第13个零件的尺寸在以外,因此需对当天的生产过程进行检查;(ii)剔除第13个数据,则均值的估计值为10.02,方差为0.09.
(ii)剔除离群值,即第13个数据,剩下数据的平均数为,这条生产线当天生产的零件尺寸的均值的估计值为10.02.
,
剔除第13个数据,剩下数据的样本方差为,
这条生产线当天生产的零件尺寸的标准差的估计值为.
9.一只药用昆虫的产卵数y与一定范围内的温度x有关,现收集了该种药用昆虫的6组观测数据如下