华中科技大学数理统计第二次作业.docx
《华中科技大学数理统计第二次作业.docx》由会员分享,可在线阅读,更多相关《华中科技大学数理统计第二次作业.docx(8页珍藏版)》请在冰豆网上搜索。
华中科技大学数理统计第二次作业
华中科技大学数理统计第二次作业
学院:
机械工程学院
1、收集到26家保险公司人员构成的数据,现希望对目前保险公司从业人员受高等教育的程度和年轻化的程度进行推断,具体来说就是推断具有高等教育水平的员工平均比例是否低于80%
35岁以下的年轻人的平均比例是否为0.5。
(数
据见练习2数据.xls—练习2.1)
解:
希望通过分析这26家保险公司人员构成的数据,研究目前保险公司从业人员受高等教育的程度和年轻化的程度。
(1)推断高等教育水平的员工平均比例是否低于80%
设原假设:
保险公司具有高等教育水平的员工比例平均值不低于0.8,即H0:
卩=卩0.8
备择假设:
H’:
卩<0.8
n=26,属于小样本,由于b2未知,选用t检验,检验统计量TB,取a=0.05
S/Jn‘
计算的X=0.729273,£=0.039274
查t检验分布表知临界值t却)=-1.7081显然,t=-1.784<-ta25)=-1.7081,因此在a=0.05
的水平上拒绝原假设,选择备择假设
结论:
保险公司具有高等教育水平的员工比例平均值低于0.8
(2)推断35岁以下的年轻人的平均比例是否为0.5
设原假设:
年轻人比例的平均值与0.5无显著性差异,即H。
:
卩=卩.=0.5
备择假设H1:
卩疋0.5.
n=26,属于小样本,由于a2未知,选用t检验,检验统计量t篙,取a=0.05
计算的X=0.713875,s2=0.022705
拒绝域:
丄卡1t/2(n1),
SM/n'
查表知a=0.05的双尾t检验临界值ta.(25)
=2.0595。
故超出[-2.0595,2.0595]的值均在拒
绝域内
由于t=7.097不在拒绝域[-2.0595,2.0595]范围内,因此在a=0.05的水平上拒绝原假设,选择
备择假设
结论:
保险公司35岁以下年轻人比例平均值不
等于0.5
2、练习1中保险公司的类别分为:
1.全国性公司;2.区域性公司;3.外资和中外合资公司。
试分析公司类别1与3的人员构成中,具有高等教育水平的员工比例的均值是否存在显著性的差异。
(数据见练习2数据.xls—练习2.1)解:
设原假设H。
:
卩1-卩2=0,即公司类别1与3具有高等教育水平的员工比例均值无显著性差异
X
Sw-■
备择假设H1:
卩1-卩2工0,a=0.05.
利用双尾t检验,选择统计量为TXY~t(mn2)11mn
由数据可得X=0.61203,y=0.81067,
22
SX=0.068303,S丫=0.014699
0.03175
c(m1)q2(n1)S22(81)*0.068303(161)*0.014699
8162
Sw—
mn2
1
816
丄XY0.612030.81067…厂t,14.56
/11<11瓦一.’O.。
3175
.mn
查表知t(8+16-2)=2.074,所以接收域为[-2.074,2.074]
由两个样本(1类和3类公司受高等教育人数比例)均值和标准差求得检验统计量t=-14.56超出接收域,故拒绝原假设,接收备择假设。
结论:
具有高等教育水平的员工比例的均值存在显著性的差异
3、欲研究不同收入群体对某种特定商品是否有相同的购买习惯,市场研究人员调查了4个不同收入组的消费者共527人,购买习惯分别为:
经常购买,不购买,有时购买。
要求:
(1)提出假设;
(2)计算x2值;(3)以99%勺显著性水平进行检验。
(数据见练习2数据.xls—练习2.3)解:
(1)设原假设H。
:
不同收入人群对该商品有相同购买习惯,即U=卩2=卩3=卩4备择假设R:
不同收入人群对该商品购买习惯不同,即口2、匕3、卜不全相等
(2)
低仪入组
隔低收入组
肋收入组
窩收人輕
音计
占全部的比率
经常购买
25
40
4?
46
158
30S
不购买
69
51
74
处
251
47.60%
有时他买
36
26
19
3"
118
22.1典
合计
130
11亍
H0
140
根据公式算出对应的期望值fe,结果如下表所示:
£0
fe
±O-±e
e)2
2/fe
2&
59
-14
b.O2S641026
40
35
6
25
0.714285714
4/
IL
5
MLj
0.S9*******
4<3
1■-
4
16
0.3B09523S1
L-L
7
49
0.j90322^81
51
-4
16
U1
74
67
7
49
073L343231
57
67
-10
1O0
1.492537313
36
29
7
49
1.639655L72
2G
•」
1
1
0.037037037
19
31
-12
114
1.G4&1GL29
37
31
Q
3G
1.101290323
使用EXCLE进行运算得X2为仃.55437331自由度为(4-1)*(3-1)=6
(3)自由度为=(R-1)(r-1)=(4-1)*(3-1)=6
a=0.01时,可以查表得:
X2(0.01)(6)=16.8拒绝域为;(16.8,+〜由于X2〉乂“,故拒绝原假设H),即认为不同收入群体对某种特定商品,没有相同
的购买习惯
结论:
不同收入人群对该商品购买习惯不同
4、由我国某年沿海和非沿海省市自治区的人均国内生产总值(GDP的抽样数据,采用各种非参数检验方法进行检验,判断它们的分布是否存在显著性差异,并进行评价。
(数据见
练习2数据.xls—练习2.4)
解:
(1)曼-惠特尼U检验
设原假设H。
:
该年我国沿海和非沿海省市自治区的人均国内生产总值(GDP)的抽样
数据的分布不存在显著性差异
备择假设Hi:
该年我国沿海和非沿海省市自治区
的人均国内生产总值(GDP)的抽样
数据的分布存在显著性差异
沿海样本数量m=12,非沿海样本数量n=18,故
WilcoxonW=Wy=180
U=W-0.5n(n+1)=9
大样本,Z=-4.19<-3,拒绝原假设,选择备择假设
结论:
该年我国沿海和非沿海省市自治区的人均国内生产总值(GDP的抽样数据的分布存在显著性差异。
(2)K-S检验
设原假设Ho:
该年我国沿海和非沿海省市自治区的人均国内生产总值(GDP)的抽样
数据的分布不存在显著性差异
备择假设H1:
该年我国沿海和非沿海省市自治区的人均国内生产总值(GDP)的抽样数据的分布存在显著性差异
将这两组样本混合并按升序排序,分别计算两组样本秩的累计频数和累计频率,计算累计频率之差,得到秩的差值序列并得到D=0.861
查表得p>0.99>(1-a)=0.95
结论:
该年我国沿海和非沿海省市自治区的人均国内生产总值(GDP的抽样数据的分
布存在显著性差异。
(3)游程检验
设原假设Ho:
该年我国沿海和非沿海省市自治区的人均国内生产总值(GDP)的抽样
数据的分布不存在显著性差异
备择假设Hi:
该年我国沿海和非沿海省市自治区的人均国内生产总值(GDP)的抽样
数据的分布存在显著性差异
由上表可知游程r=6
卩r=2mnm+n=14.4
ar2=2mn(2mn-m-n)(m+n)2(m+n-1)=6.654
Z=r-卩ra=r-3.256
p=0.00056结论:
该年我国沿海和非沿海省市自治区的人均国内生产总值(GDP的抽样数据的分
布存在显著性差异。
5、某企业在制定某商品的广告策略时,收集了该商品在不同地区采用不同广告形式促销后的销售额数据,希望对广告形式和地区是否对商品销售额产生影响进行分析,
a)以商品销售额为因变量,广告形式和地区为自变量,通过单因素方差分析方法分别对广告形式、地区对销售额的影响进行分析;
b)试进一步分析,究竟哪种广告形式的作用较明显,哪种不明显,以及销售额和地区之间的关系等。
c)试分析广告形式、地区以及两者的交互作用是否对商品销售额产生影响。
(数据见练习2数据.xls—练习2.5,其中广告形式为:
1.报纸;2.广播;3.宣传品;4.体验)
解:
a)设4种不同的广告形式后的销售额均值分别为卩、QQP4,则原假设H。
及备择假设Hi分别为:
Ho:
4种不同的广告形式对销售额无显著性影响,即口=出=出=(J4。
Hi:
4种不同的广告形式对销售额有显著性影响,
即卩、3、BB不全相等。
利用Excel数据分析中单因素方差分析可得,当a
=0.05时,F=13.48311汗叫3,140)=
2.669256,所以拒绝H。
,即有证据表明4种不同的广告形式对销售额有显著性影响。
设18个地区的销售额均值为叩=1,2,3,•--18),则原假设H。
及备择假设H分别为:
H。
:
地区对销售额无显著性影响,即
pj=32=3=34=・・・二35二36二317=318。
H1:
地区对销售额有显著性影响,即3、3、3、
3・・・36、37、38不全相等。
利用Excel数据分析中单因素方差分析可得,当a
=0.05时,F=4.062486>F%仃,126)
=1.704427,所以拒绝H。
,即有证据表明地区对销售额有显著性影响。
b)利用最小显著差异方法LSD进行分析,原假设H。
及备择假设T分别为:
H。
:
3=3(第i个总体的均值等于第j个总体的均值)
H1:
诗卩(第i个总体的均值不等于第j个总体的均值)
由公式LSDt/2|MSE(丄—),n1=n2二n3二n4=36,MSE=
”nnj'?
a=0.05
得LSD=5.61。
根据前面表中的计算结果x1=73.22,x2=70.89,
x?
=56.56,x?
=66.61,计算统计检
验量。
|x?
x?
=73.22-70.89=2.33<5.61
所以广告形式1和广告形式2对销售额无显著性影响。
|x?
x?
=73.22七6.56=16.66>5.61
所以广告形式1和广告形式3对销售额有显著性影响。
|x0x?
=73.22£6.61=6.61>5.61
所以广告形式1和广告形式4对销售额有显著性影响。
|x?
-x?
=70.89-56.56=14.33>5.61
所以广告形式2和广告形式3对销售额有显著性影响。
|x?
x?
=70.89£6.61=4.28<5.61
所以广告形式2和广告形式4对销售额无显著性影响。
|x?
x?
=66.61-56.56=10.05>5.61
所以广告形式3和广告形式4对销售额有显著性影响。
广告形式与销售额的关系强度R2
=0.224159
地区与销售额的关系强度0.354052
结论:
广告形式和地区相比,广告形式与销售额的关系强度较低,地区与销售额的关系强度较高。
c)对因素A提出的假设为
H。
:
4种不同的广告形式对销售额无显著性影响,即口=出=(13=出。
H1:
4种不同的广告形式对销售额有显著性影响,即1、1、i1不全相等。
对因素B提出的假设为
H。
:
地区对销售额无显著性影响,即
1=1=1=1=・・・=15=16=117=118。
地区对销售额有显著性影响,即1、1、1、
1・・・16、17、18不全相等。
对因素AXB提出的假设为
H0:
地区和广告形式的交互作用对销售额无显著性影响
Hi:
地区和广告形式的交互作用对销售额有显著性影响
由EXCL数据分析可知,广告形式及地区所对应的p均小于a=0.05所以拒绝H。
,即广告形式、地区对销售额有显著性影响;而广告形式与地区的交互作用所对应的p=0.296>a=0.05,所以不拒绝Ho,即没有充足证据表明广告形式与地区的交互作用对销售额有显著性影响。