ImageVerifierCode 换一换
格式:DOCX , 页数:23 ,大小:239.90KB ,
资源ID:22550527      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/22550527.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(多元正态总体均值向量和协差阵的假设检验Word文档格式.docx)为本站会员(b****7)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

多元正态总体均值向量和协差阵的假设检验Word文档格式.docx

1、X(1),X(2),,X(n),X X(i),S =7 (X(i)X)(X(i)X) on y(1)已知时均值向量的检验H。: “ 为已知向量)检验统计量:T。2 二n(X - ) E(X -二。)2(p)(在 Ho成立时)给出检验水平a,查2分布表使pTo2 . J-a,可确定出临界值 爲,再用样本值计算出To2,若 T02a,则否定Ho,否则Ho相容。这里要对统计量的选取作两点解释,一是说明它为什么取为这种形式。二是说明它为什么服从 2(p)分布。一元统计中,当C2已知时,作均值检验所取的统计量为:X - -oU o N(0,1)CT.n2 n( X - o) 2 1U 厂 n(X 7。)

2、(二)(X 7。)cr与上边给出的检验统计量To2形式相同。另外根据二次型分布定理:若XNp(0,1),则XE 4X X2(p)。显然,To2 =n(X - ) - )二.n(X n(X - )邱扩丫。其中,Y = n(X -) Np(0, Z),因此,T。2 二 n(X - ) 丁1 (应 - )2(p)。(2)三未知时均值向量的检验Ho 比: 9 p片2F(p, n-p)(在Ho成立时)(n -1)p其中 T2 =(n-1)1 n(X -%)S. n(X给定检验水平a,查F分布表,使p” n _p T2Fa = a,可确定出临界值 Fa,再用样本值计算Jn -1)p J出T2,若n _p

3、T2 Fa,则否定H。,否则H。相容。(n -1)p a o o这里需要解释的是,当匕未知时,自然想到要用样本协差阵 S去代替Z,因(n-1) S-1是匕的 n 1无偏估计量,而样本离差阵n _ _S7 (X(a)-X)(X(a)-力Wp(n 1上)x 、n( No)Np(O,1).T(n -1)1. n(乂 ) Sn(X - %) Lt2(p,n 一 p)再根据Hotelling T2分布性质,所以(n -1) 一 p 12T F(p, n-p) (n -1)p3协差阵相等时,两个正态总体均值向量的检验设X(a) =(XaXa2,,Xap) Np(叫,口 Y(a) =(Ya1,Y32,Yap

4、) NpG2):_ 1 n - 1且两组样本相互独立, X二丄7 X(j),Y=丄7 Y(i)。n y m(1)有共同已知协差阵时Ho :叫二二2To2 二巴工以 -丫)、J(Y -Y) 2(p) (在 Ho成立时)n +m 八给出检验水平a,查x2(p)分布表使PT2 a la,可确定出临界值,a,再用样本值计算出 T2, 若T02a,则否定H。,否则H0相容。在一元统计中作均值相等检验所给出的统计量:X -YN(0,1)c2 c2n m显然,(在H。成立时)其中:S S2n _ S1(X(a)-X)(X(a)-X), X =収1,2, ,Xp)a mS2 八(Y(a) -Y)(Y(a)-Y

5、) , Y =&1,Y2,Y)a 4给定检验水平:,查F分布表使PF Fa: ,可确定出Fa,再用样本值计算出 F,若则否定Ho,否则Ho相容。1 1当两个总体的协差阵未知时,自然想到用每个总体的样本协差阵 S,和 S2去代替,n _1 m _1n so (X(a)-X)(X(:.)X)Wp(n 一仁)m _ _S2 八(Y(a)-Y)(Y(.) -Y) Wp(m-1)a 3从而S = S!亠S2Wp (n亠m - 2,三)所以下述假设检验统计量的选取和前边统计量的选取思路是一样的,以下只提出待检验的假设,然后给 出统计量及其分布,为节省篇幅,不做重复的解释。4协差阵不等时,两个正态总体均值向

6、量的检验 设X (a) (X al,X a2, ,X ap ) N p C-1 ) : - !, ,nY(a)=亿1亿2,,Yap)N p 上 2) : = 1,m且两组样本相互独立, 11 . 0, 12 .0叫=)2 H1 2分两种情况(1) n = m令Z(i)=X(i)-Y(i) i =1 ,n-1 n -Z Z(i)=X -Yn i =1 n _ _s 八(z(j)-Z)(z(j)-Z)j壬n _ _八(X(j)-Y(i)-X Y)(X(jY(0 - X Y) j丘F = (n _ p)nZ,s4z F(p,n - p) (在 H0成立时)p(2) n严m,不妨假设n : n i丄s

7、 八(z(i)Z)(z(i)-Z)-i 4-:1 n xz J(X(i)-X)-J-(Y(i)送 丫(j)V | mn j检验统计量:F = 5 P)nzSdZ F(p,n - p) P5多个正态总体均值向量的检验(多元方差分析)多元方差分析是一元方差分析的推广。为此先复习一下一元方差分析,之后为了对多个正态总体均 值向量作检验,自然地先给出 Wilks分布的定义。(1)复习一元方差分析(单因素方差分析) 设k个正态总体分别为 N (叫,匚2),,N(k,;2),从k个总体取ni个独立样本如下:(1) (1) (1)X1 , X 2 , )Xn1SSA k -1F F(k-1 ,n-k)(在

8、Ho成立时)SSE n kk 9SSA-7 ni(Xi -X)组间平方和i 二km _SSE 、(Xf -Xi)2组内平方和i 4 j =1k W _SST二二(Xj -X)2总平方和i 1 jWni、X(i)j 1-1 k niX 二 一7 X (i) n = ni 亠亠 nkn i d jF值,给定检验水平,查F分布表使p、F F ,可确定出临界值 R.,再用样本值计算出若F Fa则否定Ho,否则Ho相容。(2) Wilks 分布在一元统计中,方差是刻划随机变量分散程度的一个重要特征,而方差概念在多变量情况下变为协1为样本广义方差。其差阵。如何用一个数量指标来反映协差阵所体现的分散程度呢?

9、有的用行列式,有的用迹等方法,目前 使用最多的是行列式。定义1若XNp(7二),则称协差阵的行列式为X的广义方差。称中 S 八(X(a) -X)(X(a)X)。定义2若A1 Wp(山,匕),m_p,A2Wp(门2,匕),匕.0,且A1和A?相互独立,则称,-计州人 A?为Wilks统计量,上的分布称为 Wilks分布,简记为 上上(p,nn2),其中n 1, n2为自由度。在实际应用中,经常把 上统计量化为T2统计量进而化为 F统计量,利用F统计量来解决多元统计 分析中有关检验问题。当 n2 =1时,用n代替m,可得到它们之间的关系式如下:/ 八 1上(P, n,1)=1 2 1 T2(p ,

10、n)T2 =门丄(p,n,1)A(p, n,1)由前边定理知n - p 1 2T F(p, n-p 1) npgj上严呼F(p,n_p1)p 上(P, n,1)n2=2时有如下关系:n - p 1 -(p, n,2) F(2p,2(n- p) 、(P, n,2)p=1时有:p=2时有:以上几个关系式说明对一些特殊的 计量或F统计量来近似表示,后面给出。(3)多个正态总体均值向量检验(多元方差分析)设有k个p元正态总体NpC,),,Np(%=),从每个总体抽取独立样品个数分别为 ni, “2,,nk,门! “kn,每个样品观测 p个指标得观测数据如下:第二个总体:Wilks分布表时给定检验水平:

11、,查Wilks分布表,确定临界值,然后作出统计判断。当手头没有 可用如下 2分布或F分布来近似。设一 l_;(p, n,m)V - -(n m - ( p m 1); 2) In 上1A匸 tL 2丸 R_ 丄 pm Al式中t =n +m _(p +m +1)/2 f 2 2 人晋p m -4L - 2 丄 2 c(p +m 5 /.pm _2A = 4则V近似服从 2 (pm) , R近似服从F(pm,tL -2几),这里tL -2几不一定为整数,可用与它最近的整数来作为F的自由度,且 min( p, m) 2。 3.2协差阵的检验1 一个正态总体协差阵检验设X(a)=(Xai,Xa2,,

12、Xap)(; n)来自p元正态总体N p(忙)的样本,匕未知,且匕 0。 HIpnp人=expd trSs 八(X(a) -X)(X(a) a -1H i :丄=丄 0 = I p(2)H。 3。=1 p因为Zo 0,所以存在D(D -0)使DoDlp 令 丫(a) = DX (a) = h ,n则* *Y(a)Np(D巴 DUD 疋Np(4,工)因此,检验- ?0等价于检验 二=1 P检验统计量、 J 1 eae*;feV&=exp_trS S 2 - |l 2 : j 丿S* 八(Y(a) -Y)(Y(a) -丫)a d,因为直接由分布计算临界值0很困难,所以通常采用的近似分布。Z2在Ho

13、成立时,一 2ln 极限分布是 p(p 分布。因此当np,由样本值计算出,值,若-2In,;即 : e 2,则拒绝Ho,否则H0相容。2多个协差阵相等检验设k个正态总体分别为 Np(叫,4),,NpCilk),且未知,i=1,,k。从k个总体分别取 山 个样本(i) (i) (i) x -X(a) = (X a1 , , X ap )体分别取ni个样本=1,,k; =1,,Np(k, 3),二 0且未知,i =1,,k。从 k 个总例1人的出汗多少与人体内钠和钾的含量有一定的关系。今测 20名健康成年女性的出汗多少(X1)、钠的含量(X2)和钾的含量(X3),其数据如下表。试检验H0 :-0

14、= (4,50,10):比。133.527.89.8144.540.28.4151.513.510.1168.556.47.11771.68.2186.552.810.9194.144.111.2205.640.99.4经计算X =(4.64,45.4,9.965)X 7。=(0.64,/.6,0.035)55.764 177.59 -32.374S= 177.59 3795.98 -107.16-32.374 -107.16 68.9255为了计算(X -丄。)s(X 二令Y =S(X -讥),则SY=(X - ),于是得如下方程组,55.764y_ 177.59y2 -32.374y0.6

15、4*177.59y1 +3795.98y2 107.16y3 =*.6-32.374y1 107.16y2 +68.9255y3 =0.035解得: =0.0151, y2 =-0.0015, y3 =0.0020 于是(X %)s(X 一)=(X _%)y0.0151= (0.64,4.6,0.035) -0.0015-0.0020 一=0.016494T2 二n(n - 1)(X=20 19 0.016494 =6.26772F 6.26772 =1.8719 3查 F 表得 F3,17(0.05) =3.2, F3,17(0.01) =5.18因此在a = 0.05或0.01时接受H0假

16、设。例2为了研究日、美两国在华投资企业对中国经营环境的评价是否存在差异,今从两国在华投资企业中各抽出10家,让其对中国的政治、经济、法律、文化等环境进行打分,其结果如下表:序号政治环境经济环境法律环境文化环境65352560755030553454070564178910111280110号为美国在华投资企业代号, 1020号为日本在华投资企业的代号。数据来源:国务院发展研究中心APEC在华投资企业情况调查。设两组样本来自正态总体分别记为:X(a) gw) : =1,,10Y(a) NTH) : , ,10且两组样本相互独立,共同未知协差阵 1 0H 0 :丄1 = 2 H 1 :丄1 =二

17、F =0 匕迢 p 1T2 F(p, n m - p -1)(n +m -2) pX =(64,43,30.5,63)Y =(50.5,51,40,40.5)10 _ _S1 =送(X(a) A壬-X)(X(a) -X)410-170-8017051042280332.584S2 八(Y(a)-丫的)-丫)a生512.5165-5390140139165475-52.55252.5S =S1 +S2922.5-1108590014356185807.531.5-3762.5一 0.00110.0003-0.0002-0.0002c 1 0.0003s =0.0022-0.0004-0.0016

18、1-0.00020.00130.00020.0025代入统计量中得F =7.6913查 F 分布表得 F0.01(4,5) = 4.89显然F aFo.oi(4.15)故否定H。,即认为日、美两国在华投资企业对中国经营环境的评价存在显著差异。 3.3附注近年来很多人,使用国际上著名的 SAS或SPSS软件进行统计分析,为便于和国际接轨,这里简单介绍一下现代国际统计学关于显著性检验的作法,它与国内多数统计教科书及期刊论文的处理方法不 同。为了便于直观说明这种作法的基本思想,下面以一元正态总体 U检验法、t检验法为例作介绍,对其它检验法也类似处理。设样本来自正态总体N(;2),;2已知,未知,要对

19、作显著性检验,统计假设 H。一 Hi : 0X -1观测值的平均-已知期望值|U = 12 标准方差 n该统计量在Ho成立时服从N(0,1)将给出的样本数据代入统计量中,算出统计量值,比如 U =3,说明观测的平均值与期望值之差为标准差的 3倍,由3/原则知:P( X 4。3/) =0.3%,其中 * =刃你。从上图很直观看出,在正态曲线下, -3与+3左右两尾部的面积非常小,或者说要取得一个样本平均值与期望值之差的绝对值大于它的标准方差三倍或三倍以上的概率是千分之三, 此3/1000通常称为检验的p值,这个p值是计算出来的。p值越小,则否定原假设的证据越强。由于检验统计量 U值依赖于样本数据

20、,因而p值也如此,所以有的书又称 p值为“观测”到的显著水平。那么把“观测”到的显著水平定得多小才可以拒绝原假设呢?许多统计工作者根据经验把界限定在0.05或0.01处,若p低于0.05,认为这个检验结果是统计显著的,且以 0.05的概率拒绝原假设,若 p低于0.01,认为这个检验结果是高度显著的,这里的 0.05或0.01,在一般检验中通常称为检验水平,记为,它是控制犯第一类错误的概率。例如上例取 :=0.01,而计算出的p值为0.003,比0.01小。因此应该拒绝原假设,即认为检验是高度显著的,作出这个结论,冒犯错误的风险大约是百分之一。如果统计假设 H 0 :i0 H1 0 、二2未知即作单尾检验。此时检验统计量为:右方的面积。查表知,1.34右方的面积比10%略大一点,因1.48之右的面积恰好是 10%,而1.34正好在1.48左 边,所以1.34之右的面积比10%稍微大一点。综上所述,显著性检验过程可概括为以下四步: (1)根据实际问题提出待检验的原假设和对立假设。(2)给出一个合适的检验统计量并知道它的分布。 (3)将样本观测值代入统计量中计算出统计量值,再求出p值。(4)把p值同检验水平:相比较,最后作出判断的结论。

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1