ImageVerifierCode 换一换
格式:DOCX , 页数:15 ,大小:154.45KB ,
资源ID:2380715      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/2380715.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(判别分析实例汇总.docx)为本站会员(b****1)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

判别分析实例汇总.docx

1、判别分析实例汇总例:人文与发展指数是联合国开发计划署于1990年5月发表的第一份人类发展报告中公布的。该报告建议,目前对人文发展的衡量指标应当以人生的三大要素为重点。衡量人生的三大要素的指标分别为:实际人均GDP指数、出生时的预期寿命指数、受教育程度指数(由成人识字率指数和综合总人学率指数按2/3、1/3的权重加权而得),将一生三个指数合成为一个指数就是人文发展指数。今从2007年世界各国人文发展指数(2005年)的排序中,选取高发展水平、中等发展水平和低发展水平国家各6个作为三组样品,另选四个国家作为待判样品,资料如下表所示。试用判别分析过程对以下数据资料进行判别分析,并据此对待选的四个国家

2、进行判别归类。国家人均GDP(美元)出生时的预期寿命(岁)成人识字率(%)初等、中等和高等教育入学率(%)第一类:高发展水平国家美国4189077.999.593.3德国2946179.199.288希腊2338178.99699新加坡2966379.492.587.3意大利2852980.398.490.6韩国2202977.99996第二类:中等发展水平国家古巴600077.799.887.6罗马尼亚906071.997.376.8巴西840271.788.687.5泰国867769.692.671.2菲律宾51377192.681.1土耳其840771.487.468.7第三类:低发展水

3、平国家尼泊尔155062.648.658.1尼日利亚112846.569.156.2喀麦隆229949.867.962.3巴基斯坦237064.649.940越南307173.790.363.9印度尼西亚384369.790.468.2待判组日本3126782.39985.9印度345263.76163.8中国675772.590.969.1南非1111050.882.477data develop;input type gdp life rate zhrate;cards;1 41890 77.9 99.5 93.31 29461 79.1 99.2 881 23381 78.9 96 99

4、1 29663 79.4 92.5 87.31 28529 80.3 98.4 90.61 22029 77.9 99 962 6000 77.7 99.8 87.62 9060 71.9 97.3 76.82 8402 71.7 88.6 87.52 8677 69.6 92.6 71.22 5137 71 92.6 81.12 8407 71.4 87.4 68.73 1550 62.6 48.6 58.13 1128 46.5 69.1 56.23 2299 49.8 67.9 62.33 2370 64.6 49.9 403 3071 73.7 90.3 63.93 3843 69.7

5、 90.4 68.2. 31267 82.3 99 85.9. 3452 63.7 61 63.8. 6757 72.5 90.9 69.1. 11110 50.8 82.4 77;proc discrim simple wcov distance list;/*simple:要求技术各类样品的简单描述统计量;选项WCOV要求计算类内协方差阵;选项DISTANCE要求计算马氏距离;选项LIST要求输出重复替换归类结果。由于没有给出方法选项,所以系统按缺省时的正态分布进行有关参数的估计和归类。*/class type;var gdp life rate zhrate;run;proc discr

6、im pool=test slpool=0.05 list; /*simple: */class type;priors 1=0.3 2=0.4 3=0.3 ;run;proc discrim method=npar k=2 list; /*simple: */class type;run;proc candisc out=result ncan=2; /*simple: */class type;var gdp life rate zhrate;run;proc gplot data=reult;plot can1*can2=type;run;proc discrim data=result

7、 distance list;class type;var can1 can2;run;表1 已知样本分类水平信息表2 样本统计量信息表3 类间距离及三类总体均值差异的显著性检验表3给出了类1与类2之间的马氏距离为37.58288,类1与类3之间的马氏距离为75.97603,类2与类3之间的马氏距离为10.91428.类与类之间总体均值的F检验统计量值分布为22.54978,45.58562,22.54973,对应的检验概率分别为0.0001, 0.0001,0.0001, 说明三类总体均值两辆之间的差异是显著的,因此判别分析有意义。表4 线形判别函数由表4可写出线形判别函数如下:高发展水平:

8、y1=-157.18932+0.00204gdp+1.66582life-0.37085rate+1.72851zhrate中等发展水平Y2=-99.12840+0.0006250gdp+1.49389life-0.09262rate+1.19559zhrate低发展水平:Y3=-62.22473+0.0002576gdp+1.31631life-0.08940rate+0.85253zhrate表5:用距离判别法判别分析结果由表5得,最后四个观测的归类结果为19号(日本)观测为高发展水平国家,第20号(印度)为第3类,即低发展水平国家,21号(中国)和22号(南非)归为中等发展水平国家。表6

9、 距离判别法判别分析结果小结 表6给出了分类错误信息,由输出结果可知分类错误的比率为0,即正确的比率为100%。 本程序中第二个判别分析过程的选项“pool=test”,要求进行类内协方差阵一致性检验,检验的显著性水平由选项”slpool=0.05”给出为0.05. priors语句给出了各发展水平国家的先验概率。表7 分类信息及类内协方差阵一致性检验结果 表7表明3个类的先验概率分别为0.3,0.4,0.3,类内协方差阵行列式的自然对数不相等,表明类内协方差阵不相等,而卡方统计量值为46.068898,对应的概率是0.0008,在0.05的显著性水平下是显著的,即类内协方差阵存在显著差异。由

10、于类内协方差阵不等,所以判别函数应是二次函数。表8 类间配对广义马氏距离由表8可知,类内广义马氏距离不再为0,而且类间的广义马氏距离也不再相等,因而类内协方差和先验概率对后验概率的计算是起作用的。表9 用 Bayes判别法得到的判别分析部分结果 由表9可知,用BAYES判别法对待判样品的判别结果与距离判别法结果一致。本程序中的第三个过程要求进行非参数分析,即对类密度函数进行非参数估计。选项K=2要求用最近邻的两个样品进行密度函数估计,选项list要求输出重复替换归类结果。该过程运行结果如下:表10 用NPAR方法得到的判别分析部分结果由表10可知,4个待判的样品中19号和21号归类结果与BAY

11、ES判别归类结果是一致的,但20号和22号所属类别则不能确定,这是与前面2中判别方法结果不一致的地方。 第四种FISHER判别:第一个过程执行典型判别分析。第二个过程要求绘制第一个典型变量CAN1和第二个典型变量CAN2的散点图,以便更加直观了解分类情况。第一、二个过程输出结果如下:表11 典型相关的多变量检验结果由上表对相关阵的显著性检验结果可知,至少有表12 典型相关与特征值上表可知,第一典型相关为0.969875,而第二典型相关为0.653396。第一个特征值为15.8514,所占比例为95.51%,第二个特征值为0.7450,所占比例仅有4.49%,说明只需用第一个典型变量即可。表13

12、 原始变量的典型相关系数由表12可得两个典型变量分别为:CAN1=0.0002096544gdp+0.0382960552life-0.0346472260rate+0.0988009134zhrateCan2=-0.0001135485gdp+0.0394378902life+0.0500655661rate+0.0390500134zhrate表14 类间马氏距离及各类总体均值的显著性检验由上表的显著性概率可知,在0.05的显著性水平下,三个类的总体均值两两显著不等。表15 线性判别函数由表15得3个类的线形判别函数分别为:第一类:Y1=-12.01131+4.88922can1-0.34378can2第二类:Y2=-1.16768-1.07130can1+1.08981can2第三类:y3=-7.56654-3.81792can1-0.74604can2表16 由DISCRIM利用两个典型变量进行判别部分样品归类结果上表分类结果与前几种分类方法结果一样,总错判率为0.

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1