041008应用统计学解答.docx
《041008应用统计学解答.docx》由会员分享,可在线阅读,更多相关《041008应用统计学解答.docx(11页珍藏版)》请在冰豆网上搜索。
![041008应用统计学解答.docx](https://file1.bdocx.com/fileroot1/2022-12/18/555aa2af-9f7d-4994-957c-baae90c2a215/555aa2af-9f7d-4994-957c-baae90c2a2151.gif)
041008应用统计学解答
041008[应用统计学]解答
LT
二、简答题(每小题25分,共50分)
1.在统计假设检验中,如果轻易拒绝了原假设会造成严重后果时,应取显著性水平较大还是较小,为什么?
答:
取显著性水平较小,因为如果轻易拒绝了原假设会造成严重后果,那就说明在统计假设检验中,拒绝原假设的概率要小,而假设检验中拒绝原假设的概率正是事先选定的显著性水平α。
2.加权算术平均数受哪几个因素的影响?
若报告期与基期相比各组平均数没变,则总平均数的变动情况可能会怎样?
请说明原因。
答:
加权算术平均数受各组平均数和次数结构(权数)两因素的影响。
若报告期与基期相比各组平均数没变,则 总平均数的变动受次数结构(权数)变动的影响,可能不变、上升、下降。
如果各组次数结构不变,则总平均数不变;如果组平均数高的组次数比例上升,组平均数低的组次数比例下降,则总平均数上升;如果组平均数低的组次数比例上升,组平均数高的组次数比例下降,则总平均数下降。
第二组:
一、计算题(每小题25分,共50分)
1、某一汽车装配操作线完成时间的计划均值为2.2分钟。
由于完成时间既受上一道装配操作线的影响,又影响到下一道装配操作线的生产,所以保持2.2分钟的标准是很重要的。
一个随机样本由45项组成,其完成时间的样本均值为2.39分钟,样本标准差为0.20分钟。
在0.05的显著性水平下检验操作线是否达到了2.2分钟的标准。
答案:
根据题意,此题为双侧假设检验问题
(1)原假设
:
;备择假设
:
(2)构造统计量:
,得
(3)由于
,则查表得:
(4)
,
,所以拒绝原假设,即在0.05的显著水平下没有达到2.2分钟的标准。
2、某商店为解决居民对某种商品的需要,调查了100户住户,得出每月每户平均需要量为10千克,样本方差为9。
若这个商店供应10000户,求最少需要准备多少这种商品,才能以95%的概率满足需要?
解:
设每月每户至少准备
⇨
查表得,
⇨
若供应10000户,则需要准备104400kg。
二、简答题(每小题25分,共50分)
1.解释相关关系的含义,说明相关关系的特点。
答:
变量之间存在的不确定的数量关系为相关关系。
相关关系的特点:
一个变量的取值不能由另一个变量唯一确定,当变量x取某个值时,变量y的取值可能有几个;变量之间的相关关系不能用函数关系进行描述,但也不是无任何规律可循。
通常对大量数据的观察与研究,可以发现变量之间存在一定的客观规律。
2.为什么对总体均值进行估计时,样本容量越大,估计越精确?
答:
因为总体是所要认识的研究对象的全体,它是具有某种共同性质或特征的许多单位的集合体.总体的单位数通常用N来表示,N总是很大的数.样本是总体的一部分,它是从总体中随机抽取出来、代表总体的那部分单位的集合体.样本的单位数称为样本容量,通常用n表示。
样本容量n越大,就越接近总体单位数N,样本均值就越接近总体均值,对总体均值进行估计时,估计越精确。
第三组:
一、计算题(每小题25分,共50分)
1、根据下表中Y与X两个变量的样本数据,建立Y与X的一元线性回归方程。
Y
X
5
10
15
20
120
0
0
8
10
18
140
3
4
3
0
10
fx
3
4
11
10
28
解:
设x为自变量,y为因变量,一元线性回归
设回归方程为y=
=
=
回归方程为y=150.213-1.538x
2、
每包重量(克)
包数(包)f
x
xf
x-
(x-
)2f
148—149
10
148.5
1485
-1.8
32.4
149—150
20
149.5
2990
-0.8
12.8
150—151
50
150.5
7525
0.2
2.0
151—152
20
151.5
3030
1.2
28.8
合计
100
--
15030
--
76.0
要求:
(1)计算该样本每包重量的均值和标准差;
(2)以99%的概率估计该批茶叶平均每包重量的置信区间(t0.005(99)≈2.626);
(3)在ɑ=0.01的显著性水平上检验该制造商的说法是否可信(t0.01(99)≈2.364)(4)以95%的概率对这批包装茶叶达到包重150克的比例作出区间估计(Z0.025=1.96);
(写出公式、计算过程,标准差及置信上、下保留3位小数)
二、简答题(每小题25分,共50分)
1.区间估计与点估计的结果有何不同?
答:
点估计是使用估计量的单一值作为总体参数的估计值;区间估计是指定估计量的一个取值范围都为总体参数的估计。
2.统计调查的方法有那几种?
答:
三种主要调查方式:
普查,抽样调查,统计报表。
实际中有时也用到重点调查和典型调查。
第四组:
一、计算题(每小题25分,共50分)
1、假定某化工原料在处理前和处理后取样得到的含脂率如下表:
处理前
0.140
0.138
0.143
0.142
0.144
0.137
处理后
0.135
0.140
0.142
0.136
0.138
0.140
假定处理前后含脂率都服从正态分布,问处理后与处理前含脂率均值有无显著差异。
解:
根据题中数据可得:
,
由于
<30,且总体方差未知,所以先用F检验两总体方差是否存在差异。
(1)设
:
;
则F=
由
,查F分布得
,
接受
,即处理前后两总体方差相同。
(2)设
,
则T=
,
T=1.26<
=2.2281
接受
,即处理前后含脂率无显著差异。
2、一种新型减肥方法自称其参加者在第一个星期平均能减去至少8磅体重.由40名使用了该种方法的个人组成一个随机样本,其减去的体重的样本均值为7磅,样本标准差为3.2磅.你对该减肥方法的结论是什么?
(α=0.05,μα/2=1.96,μα=1.647)
二、简答题(每小题25分,共50分)
1.解释抽样推断的含义。
答:
简单说,就是用样本中的信息来推断总体的信息。
总体的信息通常无法获得或者没有必要获得,这时我们就通过抽取总体中的一部分单位进行调查,利用调查的结果来推断总体的数量特征。
2.时期数列与时点数列有哪些不同的特点?
答:
时期数列具有以下特点:
(1)数列具有连续统计的特点;
(2)数列中各个指标数值可以相加;(3)数列中各个指标值大小与所包括的时期长短有直接关系。
时点数列具有以下特点:
(1)数列指标不具有连续统计的特点;
(2)数列中各个指标值不具有可加性;(3)数列中每个指标值的大小与其时间间隔长短没有直接联系。
第五组:
一、计算题(每小题25分,共50分)
1、某商业企业商品销售额1月、2月、3月分别为216,156,180.4万元,月初职工人数1月、2月、3月、4月分别为80,80,76,88人,试计算该企业1月、2月、3月各月平均每人商品销售额和第一季度平均每月人均销售额。
(写出计算过程,结果精确到0.0001万元\人)
解:
依题意,计算如下:
(人)
2、下表中的数据是主修信息系统专业并获得企业管理学士学位的学生,毕业后的月薪(用y表示)和他在校学习时的总评分(用x表示)的回归方程。
总评分
月薪/美元
总评分
月薪/美元
2.6
2800
3.2
3000
3.4
3100
3.5
3400
3.6
3500
2.9
3100
解:
2.6
2800
6.76
7280
7840000
3.4
3100
11.56
10540
9610000
3.6
3500
12.96
12600
12250000
3.2
3000
10.24
9600
9000000
3.5
3400
12.25
11900
11560000
2.9
3100
8.41
8990
9610000
=19.2
=18900
=62.18
=60910
59870000
设
=
=581.08
=18900/6-581.08*19.2/6=1290.54
于是
二、简答题(每小题25分,共50分)
1.为什么要计算离散系数?
答:
离散系数是指一组数据的标准差与其相应得均值之比,也称为变异系数。
对于平均水平不同或计量单位不同的不同组别的变量值,是不能用方差和标准差比较离散程度的。
为消除变量值水平高低和计量单位不同对离散程度测度值的影响,需要计算离散系数。
离散系数的作用主要是用于比较不同总体或样本数据的离散程度。
离散系数大的说明数据的离散程度也就大,离散系数小的说明数据的离散程度也就小。
2.简述算术平均数、几何平均数、调和平均数的适用范围。
答:
几何平均数主要适用于比率的平均。
一般地说,如果待平均的变量x与另外两个变量f和m有fx=m的关系时,若取f为权数,应当采用算术平均方法;若取m为权数,应当采用调和平均方法。
要求:
1.独立完成,作答时要写明题型、题号;
2.作答方式:
手写作答或电脑录入,使用A4格式白纸;
3.提交方式:
以下两种方式任选其一,
1)手写作答的同学可以将作业以图片形式打包压缩上传;
2)提交电子文档的同学可以将作业以word文档格式上传;
4.上传文件命名为“中心-学号-姓名-科目.rar”或“中心-学号-姓名-科目.doc”;
5.文件容量大小:
不得超过20MB。