应用多元统计分析(全套课件533P)11优质PPT.pptx

上传人:b****9 文档编号:13002714 上传时间:2022-10-02 格式:PPTX 页数:532 大小:19.57MB
下载 相关 举报
应用多元统计分析(全套课件533P)11优质PPT.pptx_第1页
第1页 / 共532页
应用多元统计分析(全套课件533P)11优质PPT.pptx_第2页
第2页 / 共532页
应用多元统计分析(全套课件533P)11优质PPT.pptx_第3页
第3页 / 共532页
应用多元统计分析(全套课件533P)11优质PPT.pptx_第4页
第4页 / 共532页
应用多元统计分析(全套课件533P)11优质PPT.pptx_第5页
第5页 / 共532页
点击查看更多>>
下载资源
资源描述

应用多元统计分析(全套课件533P)11优质PPT.pptx

《应用多元统计分析(全套课件533P)11优质PPT.pptx》由会员分享,可在线阅读,更多相关《应用多元统计分析(全套课件533P)11优质PPT.pptx(532页珍藏版)》请在冰豆网上搜索。

应用多元统计分析(全套课件533P)11优质PPT.pptx

的检验进而引入到多元总体均值的检验,第三从一元方差分析入手介绍方差分,。

析的原理进而到多元方差分析,第四主要讲述把对象分类和归类的聚类与判别分析的基本原理和实现方法。

,第五是寻找多个变量的代表:

主成分分析和因子分析,第六介绍能反映行变量和列变量的列联分析和对应分析,第七介绍能够确定两组变量的关系:

典型相关分析本课程的主要内容主要介绍各种多元统计分析方法的基本思路和原理,而不主要讲述各种方法的数学推导过程;

主计要利用统软件SPSS,学习和掌握各种多元统计方法;

从数据入手,来讲述各种分析方法,最后得出结论;

学习的目标在理解多元统计分析方法的种方法下:

基本原理和掌握每的应用前提条件,会使用统计软件SPSS,进行多元统计分析。

本课程特点多元统计分析何晓群、中国人民大学出版社多元统计分析于秀林、任雪松中国统计出版社多元统计引论张尧庭、方开泰、科学出版社-SPSS社会统计分析方法软件应用郭志刚、中国人民大学出版社统计分析与spss的应用薛薇、中国人民大学出版社本课程的主要参考书目多元统计的产生和应用,多元分析起源于本世纪初1928年Wishart发表论文多元正态总体样本协方差阵的精确分布,是多元分析的开端。

计多元统分析主要发展于三、四十年代,Fisher、Hotelling、Roy、徐宝禄等人做了一系列的多元统计分析的理论探索。

,但是由于多元分析的计算复杂计算量又大使其发展受到影响。

随着计算机的普遍应用及统计,软件的广泛应用多元统计重新出现活力现已大量应用于各种领域中。

多元统计的产生经济学上的应用:

如不同地区的经济发展水平比较,综合的经济效益评价等医学上的应用:

如研究某种病的起因,研究某种新药或某种医疗方法的治疗效果,利用计算机初步诊断病情等。

体育科学的研究:

如对运动员的心理研究、体能研究等。

另外在生态学、地质学、社会学、考古学、生物学、军事科学等等领域,多元统计都得到了广泛的应用。

多元统计的应用复旦大学李贤平教授与它的学生对红楼梦进行了多元统计分析。

把红楼梦的120回,作为120个样本,以虚词做为变量,计算在每一回中(样本)变量(虚词)出现的次数,然后用聚类的方法进行分类。

结论:

120回分为两类前80回为一类进一步与曹雪琴著作相比分析,答案是肯定的。

后40回为一类进一步分析,证实不是多元统计的应用到现有统计系某年级三个班(经分、调预、电统)的学生(部分)在某学期完成的课程学习成绩资料(见下表)。

其中三个班级相同的课程有六门:

经济统计、管理统计、调查理论与方法、银行信用学、统计预测和计量经济学。

请将这三个班学生的学号、班级、性别以及六门课程的成绩输入SPSS中,并保存(自己可现编几个数据)。

SPSS软件应用的回顾请将下表数据以变量形式输入SPSS中,并能以该表的形式输出,以文件保存。

SPSS软件应用的回顾观点:

赞成观点:

不赞成低收入中等收入高收入低收入中等收入高收入男201010女25155752879第二章多元数据与变量变量的类型变量的数字特征均值方差协方差相关多个变量随机向量我们所讨论的是多个变量的总体,所研究的数据是同时观测p个指标(即n变量),又进行了次观测得到的,常用向量表示:

2PX(X1,X,L,X)样品变量X1X2XP12nx11x21xn1x21x22xn2xP1xP2xPn(随机向量样本资料矩阵可用矩阵语言表达:

)()2()1(212211)npnpn1pXXXXXXxxn2xxpx22xxx12x11XMLMMMLL,L,XXX随机向量的数字特征X随机向量的均值:

mmmpPEEXMM2m1E()2)

(1)(随机向量的数字特征X:

随机向量自协方差阵s随机向量的数字特征X随机向量的相关阵D(X)jicov(Xi,Xj)rij,i,j1,2,L,pD(X)R(corr(Xi,Xj)(rij)pp21

(2)(P随机向量的数字特征随机向量X和Y的协方差阵设)nXX1,X,L,XYY,Y,L,Y和分别为n维和p维随机向量,则:

cov(X,Y)(cov(Xi,Yj),i1,L,n;

j1,L,p)若cov(X,Y)=0,称X和Y是不相关的变量的标准化在数据处理时,为了克服由于指标的量纲不同对统计分析结果带来的影响,往往在实用某种统计分析方法之前,常需将每个指标“标准化”,即作如下变换:

一元:

x*xE(x)标准化的例子标准化的目的正态分布图形随机向量的数字特征在数据处理时,为了克服由于指标的量纲不同对统计分析结果带来的影响,往往在实用某种统计分析方法之前,常需将每个指标“标准化”,即作如下变换:

DXX0,(*)corr(X)R于是:

E()*jjvarX多元:

X*XjE(Xj)E(x)一元:

x*x即标准化数据的协方差阵正好是原指标的相关阵多元数据的几何表示三变量的散点图星图切尔诺夫脸树状图神经网络图第三章多元正态分布多元分布的基本概念随机向量我们所讨论的是多个变量的总体,所研究的数据是同时观测p个指标(即n变量),又进行了次观测得到的,常用向量表示:

)()2()1(212211)npnpn1pXXXXXXxxn2xxpx22xxx12x11XMLMMMLL,L,()(1(2P)()PX分布函数与密度函数随机变量的分布函数:

F(xx随机向量的分布函数FxFx,x,L,x)PX1x1,LXpxp)ttx,t分布函数与密度函数随机变量的密度函数:

随机向量的密度函数tt11dpLtp)dLx1xpF()Lf(xF(x)f()d一元正态分布021(22)(,spssm2xex)f方差是:

均值是:

m2s标准差是:

s2)ms记为:

N(,多元正态分布多元正态分布的密度函数为)21/21mmp)1(xexp1(x(xfp1)p/2(2,L,x)XNp(m,)记为:

均值向量是:

m协方差阵是:

多元正态分布多元正态分布多元正态分布1定理,XN()设,则E(X)=,D(X)=2定理正态分布的条件分布仍为正态分布2(均值向量和协方差阵的估计在实际问题中,通常可以假定被研究对象是多元正态分布,但分布中的参数和是未知的,一般的做法是通过样本来估计。

设样本资料为:

()2()1(12211)n)pnpn1pXXXxn2xxxpx22xxx11x12XMLMMMLLX,X,L,Xipiii均值向量和协方差阵的估计则总体参数均值的估计量是:

PniXXXnXMMX1X2X2X111m即均值向量的估计量,就是样本均值向量均值向量和协方差阵的估计总体参数协方差阵的极大似然估计是)X)X(X(XSnn11(i)n(i)mi1S1n1均值向量和协方差阵的检验均值向量和协方差阵的检验在一元统计中,对正态总体均差检验时Z常用的分布有:

分布,tF值和方X2分布,分布,分布。

量X2布那么对于多元正态总体的均值向和协方差阵的检验也会用到相应的分布:

Wishart(p17)分布(维希特)分tHotellingT2分布分布(p23)FWilks(p27)分布分布10均值向量的检验总体当已知用ZZ分布检验。

当tt,。

未知时用统计量和分布检验,(一元检验的回顾从N2)中抽了一个样本,要检验假设设ma0:

m:

m,m统计量和时m0HH2a2a均值向量的检验多元均值检验假设:

T2T2的T过已知协差阵和未知协差阵2统计量计算方法不同。

00:

10HH需要用统计量和分布来检验。

只不均值向量的检验均值向量的检验又可分为:

一个样本与已知总体均值向量的检验两总体均值向量的检验多总体均值向量的检验以上的检验过程都可由SPSS软件中的Multivariate来完成。

协方差阵的检验:

又分为两总体的协差阵相等的检验:

多总体的协差阵相等的检验:

该检验可由SPSS软件的Multivariate中的BoxsM检验来完成。

01Lr第四章多元正态总体量和斜均值向方差阵的检验假设检验的回顾第一节在2004年对该妇女(还是了随机抽100高162为什么要假设检验?

妇女的例子,我们举如身高对果在2002年10000名身面妇女的高进行了全调查平均身高,得出为160cm,标准差为5cm。

原总体)进行样调查,调查了名妇女,测得样本身cm,标准差为5cm。

请问:

调查结果是否说明这批妇女的身高升高了?

为什么要假设检验?

为了回答这个问题,我们必须知道:

样本平均身高与总体平均身高之差cxX1621602m是由什么原因造成(或带来)的,即是抽样误差造成的身高没变化m2c产生的原因不仅是误差,确实是身高发生了变化为什么要假设检验?

又如:

同一位老师教授统计系本科两个班同一门课程,如果两个班考试内容和形式完全一样,但是平均成绩却不同:

2874.8210.06分一班人,平均成绩分,标准差三班人,平均成绩分,标准差3876.749.11分.sav请问:

这两个班的平均成绩是否有显著的差异?

(学生成绩)为什么要假设检验?

还有:

某减肥产品夸口说它的减肥效果是如何如何的好,如果我们有一些志愿者对该产品试服减肥,减肥前和减肥后的体重发生了一些差异。

(具体数据见数据:

spssdiet.sav):

请问体重发生的差异是否显著的?

即减肥是否真有效果,是否能相信该减肥产品的减肥效果?

这样的例子很多,其实只要我们进行比较、判断时:

总体与样本,比,不同总体之间比样本与样本比等,都要用到假设检验。

那么如何检验呢?

如何假设检验?

还是回到妇女身高的例子,已知样本均值与总体均值相差2cm,这2cm是如何造成的?

是抽样误差造成的身高没变化2cm产生的原因不仅是误差,确实是身高发生了变化

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > IT计算机 > 电脑基础知识

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1