应用多元统计分析SAS作业.docx

上传人:b****8 文档编号:24061177 上传时间:2023-05-23 格式:DOCX 页数:15 大小:1.60MB
下载 相关 举报
应用多元统计分析SAS作业.docx_第1页
第1页 / 共15页
应用多元统计分析SAS作业.docx_第2页
第2页 / 共15页
应用多元统计分析SAS作业.docx_第3页
第3页 / 共15页
应用多元统计分析SAS作业.docx_第4页
第4页 / 共15页
应用多元统计分析SAS作业.docx_第5页
第5页 / 共15页
点击查看更多>>
下载资源
资源描述

应用多元统计分析SAS作业.docx

《应用多元统计分析SAS作业.docx》由会员分享,可在线阅读,更多相关《应用多元统计分析SAS作业.docx(15页珍藏版)》请在冰豆网上搜索。

应用多元统计分析SAS作业.docx

应用多元统计分析SAS作业

5-9设在某地区抽取了14块岩石标本,其中7块含矿,7块不含矿。

对每块岩石测定了Cu,Ag,Bi三种化学成分的含量,得到的数据如表1。

表1岩石化学成分的含量数据

类型

序号

Cu

Ag

Bi

类型

序号

Cu

Ag

Bi

 

1

2.58

0.90

0.95

 

8

2.25

1.98

1.06

2

2.90

1.23

1.00

9

2.16

1.80

1.06

3

3.55

1.15

1.00

10

2.33

1.74

1.10

4

2.35

1.15

0.79

11

1.96

1.48

1.04

5

3.54

1.85

0.79

12

1.94

1.40

1.00

6

2.70

2.23

1.30

13

3.00

1.30

1.00

7

2.70

1.70

0.48

14

2.78

1.70

1.48

(1)假定两类样本服从正态分布,使用广义平方距离判别法进行判别归类(先验概率取为相等,并假定两类样本的协方差阵相等);

(2)今得一块标本,并测得其Cu,Ag,Bi的含量分别为2.95,2.15和1.54,试判断该标本是含矿还是不含矿?

问题求解

1使用广义平方距离判别法对样本进行判别归类

用SAS软件中的DISCRIM过程进行判别归类。

SAS程序及结果如下。

datad59;

inputgroupx1-x3@@;

cards;

12.580.90.95

12.91.231

13.551.151

12.351.150.79

13.541.850.79

12.72.231.3

12.71.70.48

22.251.981.06

22.161.81.06

22.331.741.1

21.961.481.04

21.941.41

231.31

22.781.71.48

procprintdata=d59;

run;

procdiscrimdata=d59pool=yesdistancelist;

classgroup;

varx1-x3;

run;

由输出结果可知,两总体间的广义平方距离为D2=3.19774。

还可知两个三元总体均值相等的检验结果:

D=3.19774,F=3.10891,p=0.0756<0.10,故在显著性水平

时量总体的均值向量有显著差异,即认为讨论这两个三元总体的判别问题是有意义的。

线性判别函数为:

判别结果为含矿的6号样本错判为不含矿;不含矿的13号样本错判为含矿。

2对给定样本判别归类

将Cu,Ag,Bi的含量数值2.95、2.15、1.54分别代入线性判别函数得:

贝叶斯判别的解

由于

,因此待判的样品判为不含矿。

5-10已知某研究对象分为三类,每个样品考察4项指标,各类的观测样品数分别为7,4,6;类外还有3个待判样品(所有观测数据见表2)。

假定样本均来自正态总体。

表2判别分类的数据

样品号

X1

X2

X3

X4

类别号

1

6.0

-11.5

19.0

90.0

1

2

-11.0

-18.5

25.0

-36.0

3

3

90.2

-17.0

17.0

3.0

2

4

-4.0

-15.0

13.0

54.0

1

5

0.0

-14.0

20.0

35.0

2

6

0.5

-11.5

19.0

37.0

3

7

-10.0

-19.0

21.0

-42.0

3

8

0.0

-23.0

5.0

-35.0

1

9

20.0

-22.0

8.0

-20.0

3

10

-100.0

-21.4

7.0

-15.0

1

11

-100.0

-21.5

15.0

-40.0

2

12

13.0

-17.2

18.0

2.0

2

13

-5.0

-18.5

15.0

18.0

1

14

10.0

-18.0

14.0

50.0

1

15

-8.0

-14.0

16.0

56.0

1

16

0.6

-13.0

26.0

21.0

3

17

-40.0

-20.0

22.0

-50.0

3

1

-8.0

-14.0

16.0

56.0

2

92.2

-17.0

18.0

3.0

3

-14.0

-18.5

25.0

-36.0

(1)试用马氏距离判别法进行判别分析,并对3个待判样品进行判别归类。

(2)使用其他的判别法进行判别分析,并对3个待判样品进行判别归类,然后比较之。

问题求解

1判别分析及判别归类

使用SAS软件中的DISCRIM过程进行判别归类,SAS程序及结果如下。

datad510;

inputx1-x4group@@;

cards;

6-11.519901

-11-18.525-363

90.2-171732

-4-1513541

0-1420352

0.5-11.519373

-10-1921-423

0-235-351

20-228-203

-100-21.47-151

-100-21.515-402

13-17.21822

-5-18.515181

10-1814501

-8-1416561

0.6-1326213

-40-2022-503

-8-141656.

92.2-17183.

-14-18.525-36.

procprint;

run;

procdiscrimdata=d510simple

pcovwsscppsscpwcov

distancelist;

classgroup;

varx1-x4;

run;

 

从结果来看,样本2、3类之间的马氏距离为d212=1.34,检验

的F统计量为0.63177,相应的p=0.651>0.10,故在显著性水平

时量总体2、3类的均值向量没有显著差异,即认为对讨论样本分为2、3类的判别问题是没有太大意义的。

此外,判别结果中两个样本被判错归类:

1类中8号样本应属于2类,2类中9号样本应属于1类;且待判得三个样本分别属于1,2,3类。

2二次判别函数判别

由第一问SAS运行结果可知三个总体的协方差阵不同,因此使用二次判别函数进行判别。

此时贝叶斯判别的解

其中

将第一问中SAS程序procdiscrimdata=d510后加入pool=no,使其采用二次判别函数进行再分类,变动部分程序如下:

procdiscrimdata=d510simplepool=no

distancelist;

程序运行结果如下图。

由此可知,17个观测全部判别正确;待判的三个观测依次判归1,1,3类。

5-11某城市的环保监测站与1982年在全市均匀地布置了14个监测点,每日三年次定时抽取大气样品,测量大气中的二氧化硫、氮氧化物和飘尘的含量。

前后5天,每个取样点(监测点)每种污染元素实测15次,取15次实测值的平均作为该取样点的大气污染元素的含量(数据见表3)。

表中最后一列给出的类号是使用第六章将介绍的聚类分析方法分析得到的结果(第1类为严重污染地区,第2类为一般污染地区,第3类为基本没有污染地区)。

表3大气污染数据

污染元素

样品号

二氧化硫

(X1)

氮氧化物

(X2)

飘尘

(X3)

类别

1

0.045

0.043

0.265

2

2

0.066

0.039

0.264

2

3

0.094

0.061

0.194

2

4

0.003

0.003

0.102

3

5

0.048

0.015

0.106

3

6

0.210

0.066

0.263

1

7

0.086

0.072

0.274

2

8

0.196

0.072

0.211

1

9

0.187

0.082

0.301

1

10

0.053

0.060

0.209

2

11

0.020

0.008

0.112

3

12

0.035

0.015

0.170

3

13

0.205

0.068

0.284

1

14

0.088

0.058

0.215

2

15

0.101

0.052

0.181

16

0.045

0.005

0.122

(1)试用广义平方距离判别法建立判别准则(假设三个总体为多元正态总体,其协方差阵相等,先验概率取为各类样本的比例),并列出回判结果。

(2)该城市另有两个单位在同一期间测定了所在单位大气中这三种污染元素的含量(见表3中最后两行),试用马氏距离判别方法判断这两个单位的污染情况属于哪一类。

问题求解

用SAS软件中的DISCRIM过程进行判别归类。

datad511;

inputx1-x3group@@;

cards;

0.0450.0430.2652

0.0660.0390.2642

0.0940.0610.1942

0.0030.0030.1023

0.0480.0150.1063

0.2100.0660.2631

0.0860.0720.2742

0.1960.0720.2111

0.1870.0820.3011

0.0530.0600.2092

0.0200.0080.1123

0.0350.0150.1703

0.2050.0680.2841

0.0880.0580.2152

0.1010.0520.181.

0.0450.0050.122.

procprint;

run;

procdiscrimdata=d511simpledistancelist;

classgroup;

varx1-x3;

run;

由输出结果可知三个三元总体均值相等的检验结果中均满足p<0.10,故在显著性水平

时量总体的均值向量有显著差异,即认为讨论这三个三元总体的判别问题是有意义的。

判别结果:

14个监测点全部判对。

且待判的两个观测点依次判归2,3类。

 

欢迎您的下载,

资料仅供参考!

 

致力为企业和个人提供合同协议,策划案计划书,学习资料等等

打造全网一站式需求

 

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 总结汇报 > 学习总结

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1