多元统计分析方法与应用练习册Word格式.docx

上传人:b****3 文档编号:18412324 上传时间:2022-12-16 格式:DOCX 页数:17 大小:102.02KB
下载 相关 举报
多元统计分析方法与应用练习册Word格式.docx_第1页
第1页 / 共17页
多元统计分析方法与应用练习册Word格式.docx_第2页
第2页 / 共17页
多元统计分析方法与应用练习册Word格式.docx_第3页
第3页 / 共17页
多元统计分析方法与应用练习册Word格式.docx_第4页
第4页 / 共17页
多元统计分析方法与应用练习册Word格式.docx_第5页
第5页 / 共17页
点击查看更多>>
下载资源
资源描述

多元统计分析方法与应用练习册Word格式.docx

《多元统计分析方法与应用练习册Word格式.docx》由会员分享,可在线阅读,更多相关《多元统计分析方法与应用练习册Word格式.docx(17页珍藏版)》请在冰豆网上搜索。

多元统计分析方法与应用练习册Word格式.docx

2

3

4

6

7

8

9

40

35

150

160

155

39.3

40.0

40.9

41.5

40.3

40.5

40.7

40.2

40.6

(1)求Y关于X1、X2的线性回归方程;

(2)对所求得的方程作显著性检验,在α=0.05时你的结论是什么?

(3)对各回归系数作显著性检验。

(α=0.05)

(4)对回归方程的残差进行正态性、独立性、随机性及奇异值检验。

(5)回归方程的回归平方和、残差平方和各为多少。

(6)求回归方程的复相关系数,并对拟合优度进行检验,若消除自变量个数及样本个数对回归方程的影响,拟合优度宜采用哪个指标,其值为多少。

(7)在排除其它因素的影响后,自变量X1与因变量Y之间的相关程度是多少。

(8)当排除其它因素对X2的影响后,X2进入回归方程,R2增加了多少?

(9)X1、X2与Y的简单相关系数分别是多少?

3.某服装厂发现本厂的服装销售额与该厂所在城市的服装销售总额及人均衣着用品的支出额关系密切。

现有26期的原始数据如下:

179.6

226.2

327.4

463.4

620.2

935.4

1175

658.1

468.5

539.3

697.1

894.9

1050.9

12.57

16.48

21.4

21.5

31.14

40.05

40.76

21.52

26.09

30.99

38.71

46.19

55.13

0.19

2.07

2.16

2.92

4.85

7.14

12.06

6.62

7.73

9.01

10.78

13.22

16.84

740.2

687.1

956.4

1223.3

1441.3

1561.3

1683.5

1466.5

1621.7

1465.8

1632.5

2207.6

2498.6

47.45

34.03

54.59

71.23

82.89

86.22

92.72

73.64

81.13

73.50

81.93

99.63

113.63

18.93

12.33

18.34

23.52

28.77

28.65

28.56

21.40

22.13

21.61

21.46

30.01

36.60

(1)以服装厂所在城市服装销售总额为自变量X1,以人均衣着用品支出额为自变量X2,该厂服装销售额为因变量Y建立二元线性回归方程。

(2)若了解到明年本城市服装销售总额X1为2700万元,X2将是128元,试求明年该厂服装销售额的预测值及预测区间(α=0.05)

(3)对回归方程的显著性作检验;

(4)对每一个回归系数的显著性作检验;

(5)求出回归方程的复相关系数;

(6)对回归方程的残差作奇异值检验

4.在经济流通领域中,某公司的年销售额Y与个人可支配收入X1,价格X2,研究与发展费X3,广告费X4等项有关。

(数据见光盘中“习题数据库”中204.sav文件)

(1)试根据资料用逐步回归的方法建立线性回归方程。

(引入变量、剔除变量的临界值为1.5)

(2)变量进入回归模型的顺序是什么,哪些变量未进入方程。

(3)最终方程的拟合优度如何,请评价之。

5.某地区大春粮食产量y和大春粮食播种面积x1、化肥用量x2、肥猪发展头数x3、水稻抽穗扬花期降雨量x4的数据见光盘中“习题库数据”205.sav文件,试用逐步回归分析,寻求大春粮食产量的预报模型(选取引入和剔除检验临界值为2.5)。

6.某种水泥在凝固时放出的热量y(卡/克)与水泥中四中化学成分有关,现测得13组数据,见光盘中“习题库数据”206.sav文件,

(1)用逐步回归法建立线性回归方程(检验临界值为4)

(2)对自变量X4的状态进行说明。

第三章主成分分析

1.主成分分析是通过适当的变量替换,使新变量成为原变量的___________,并寻求_________的一种方法。

2.主成分分析的基本思想是______________。

3.主成分的协方差矩阵为_________矩阵。

4.主成分表达式的系数向量是_______________的特征向量。

5.原始变量协方差矩阵的特征根的统计含义是________________。

6.原始数据经过标准化处理,转化为均值为____,方差为____的标准值,且其________矩阵与相关系数矩阵相等。

7.因子载荷量的统计含义是_____________________________。

8.样本主成分的总方差等于_____________。

9.变量按相关程度为,在__________程度下,主成分分析的效果较好。

10.在经济指标综合评价中,应用主成分分析法,则评价函数中的权数为________________。

11.SPSS中主成分分析采用______________命令过程。

二、简答题

1.简述主成分的概念及几何意义。

2.简述量纲对主成分分析的影响及消除方法。

3.列举样本主成分的性质。

4.提取样本主成分的原则。

5.简述主成分分析的适用范围及基本步骤。

6.思考主成分分析法的应用。

三、计算题

1.设三个变量(x1,x2,x3)的样本协方差矩阵为:

试求主成分及每个主成分的方差贡献率。

2.在一项研究中,测量了376只鸡的骨骼,并利用相关系数矩阵进行主成分分析,见下表:

Y1

Y2

Y3

Y4

Y5

Y6

头长x1

头宽x2

肱骨x3

尺骨x4

股骨x5

胫骨x6

0.35

0.33

0.44

0.43

0.53

0.70

–0.19

–0.25

–0.28

–0.22

0.76

-0.64

-0.05

-0.02

-0.06

0.00

0.48

–0.51

–0.48

-0.04

–0.15

–0.67

–0.70

–0.04

0.59

–0.63

0.15

特征值

4.57

0.71

0.41

0.17

0.08

0.06

(1)解释6个主成分的实际意义。

(2)计算前三个主成分各自的贡献率和累积贡献率。

(3)对于y4,y5,y6的方差很小这一点,你怎样对实际情况作出推断。

3.在一项对杨树的性状的研究中,测定了20株杨树树叶,每个叶片测定了四个变量:

叶长(x1),2/3处宽(x2),1/3处宽(x3),1/2处宽(x4)。

这四个变量的相关系数矩阵的特征根和标准正交特征向量分别为:

(1)写出四个主成分,计算它们的贡献率。

(2)计算四个变量在前两个主成分上的载荷,由因子载荷矩阵,你认为这两个主成分应该如何解释?

你能给它们分别起个名字吗?

(3)根据原始数据和

(1)中的结果,可以计算出20株杨树叶的第一、二主成分得分,试以这两个主成分y1和y2为坐标,在(y1,y2)平面上按因子得分为坐标描出这20个样本点。

4.对纽约股票市场上的五种股票的周回升率x1,x2,x3,x4,x5进行了主成分分析,其中x1,x2,x3分别表示三个化学工业公司的股票回升率,x4,x5表示两个石油公司的股票回升率,主成分分析是从相关系数矩阵出发进行的,前两个特征根和对应的标准正交特征向量为:

(1)计算这两个主成分的方差贡献率。

(2)能否对这两个主成分的意义作一个合理的解释,并给两个主成分命名。

1.下面是8个学生两门课程的成绩表:

英语x1

数学x2

100

65

90

85

70

55

45

(1)求出两个特征根及其对应的单位特征向量;

(2)求出主成分,并写出表达式;

(3)求出主成分的贡献率,并解释主成分的实际意义;

(4)求出两个主成分的样本协方差矩阵;

(5)第1个样本主成分与第2个变量样本之间的相关系数为多少

(6)求出8个学生第一主成分得分并进行排序

2.某中学十二名女生的身高x1,体重x2的数据如下:

11

12

身高

体重

48

153

46

157

154

158

49

152

156

51

47

159

161

50

(1)两个变量的协方差矩阵与相关系数阵;

(2)两个特征根及其对应的单位特征向量;

(3)主成分的表达式并解释各贡献率的大小意义和主成分的实际意义;

(4)如果舍弃主成分y2,则哪一个原变量的信息损失量最大;

(5)画出全部样本的主成分散点图。

3.根据下列某地区11年数据

X1(总产值)

X2(存储量)

X3(总消费)

y(进口额)

149.3

161.2

171.5

175.5

180.8

190.7

202.1

212.4

226.1

231.9

239.0

4.2

4.1

3.1

1.1

2.2

2.1

5.6

5.0

5.1

0.7

108.1

114.8

123.2

126.9

132.1

137.7

146.0

154.1

162.3

164.3

167.6

15.9

16.4

19.0

19.1

18.8

20.4

22.7

26.5

28.1

27.6

26.3

(1)计算地区总产值、存储量和总消费的相关系数矩阵。

(2)求特征根及其对应的特征向量。

(3)求出主成分及每个主成分的方差贡献率;

(4)利用主成分方法建立y与x1,x2,x3的回归方程(取两个主成分)。

第四章因子分析

一、填空题

1.因子分析是把每个原始变量分解为两部分因素,一部分是______________,另一部分为_______________。

2.变量共同度是指因子载荷矩阵中_______________________。

3.公共因子方差与特殊因子方差之和为_______。

1.比较因子分析和主成分分析模型的关系,说明它们的相似和不同之处。

2.能否将因子旋转的技术用于主成分分析,使主成分有更鲜明的实际背景。

三、计算题

1.已知x=(x1,x2,x3,x4,x5)`的样本相关系数矩阵R为

试用主对角线外每一行的最大值来估计约化相关系数矩阵R*的主对角线上的相应元素,并近似地计算出因子载荷矩阵A的第一列元素。

2.设变量x1,x2和x3已标准化,其样本相关系数矩阵为:

(1)对变量进行因子分析。

(2)取q=2进行正交因子旋转。

3.为了考察学生的知识水平,常用学生的考试成绩来评定,某校对33个学生的3门功课进行分析,得相关系数矩阵:

取两个公因子

(1)计算约化相关系数矩阵

(2)计算因子载荷矩阵

(3)计算各变量的公共因子方差和特殊因子方差

(4)写出因子模型

1.10名初中男生身高、胸围、体重的数据资料如下:

身高x1(cm)

胸围x2(cm)

体重x3(kg)

149.5

162.5

162.7

162.2

156.5

156.1

172.0

173.2

159.5

157.7

69.5

77.0

78.5

87.5

74.5

76.5

81.5

79.0

38.5

55.5

50.8

65.5

49.0

45.5

51.0

59.5

43.5

53.5

(1)利用因子法、方差最大旋转法计算因子载荷阵A

(2)分别计算各变量的公共因子方差和特殊因子方差,判断哪个因子能概括原始信息的大部分,为什么

(3)写出方差最大正交旋转因子模型,并分析各因子的实际含义

(4)计算各个样本点的因子得分

第五章聚类分析

1.聚类分析是建立一种分类方法,它将一批样哂或变量按照它们在性质上的_______________进行科学的分类。

2.Q型聚类法是按_________进行聚类,R型聚类法是按_______进行聚类。

3.Q型聚类统计量是__________,而R型聚类统计量通常采用______________。

4.在聚类分析中需要对原始数据进行无量纲化处理,以消除不同量纲或数量级的影响,达到数据间可同度量的目的。

常用的无量纲化方法有以下几种:

_____________、____________、________、_______。

5.六种Q型聚类方法分别为___________、____________、_________、_____________、___________、_____________。

6.快速聚类在SPSS中由_______________过程实现。

二、简答题

1.简述系统聚类法的基本思想及主要步骤。

2.简述最长聚类法的聚类步骤。

3.简述快速聚类的基本思想及主要步骤。

1.下面给出了八个样品的两个指标数据

13

14

16

使用按批修改法进行聚类,采用欧氏距离(取1、3、7号样本为聚点)。

2.从20个工厂抽了同类产品,每个产品测了两个指标,欲将各厂的质量进行分类,测得的数据如下(已作了适当变换)

17

18

19

-4

-2

-3

-5

-1

试用欧氏距离,将每个样本与其距离最近的凝聚眯进行初始归类(用密度法取聚点)。

1.某校从高中二年级女生中随机抽取16名,测得身高和体重数据如下表:

身高(cm)

体重(kg)

169

162

165

41

52

43

163

44

试分别利用最短距离法、最长距离法、重心法、类平均法、中间距离法将它们聚类(分类统计量采用绝对距离),并画出聚类图。

2.从不同地区采集了七块花岗岩,测其部分化学成分如下:

SiO2

TiO2

FeO

CaO

K2O

75.20

0.14

1.86

0.91

5.21

75.15

0.16

2.11

0.74

4.93

72.19

0.13

1.52

0.69

4.65

72.35

1.37

0.83

4.87

72.74

0.10

1.41

0.72

4.99

73.29

0.033

1.07

3.15

73.72

0.77

0.28

2.78

试作如下分析:

(1)样本间用欧氏距离,并用系统聚类的诸方法对样本进行聚类。

(2)将数据标准化后,仍用欧氏距离,然后用系统聚类的诸方法对样本进行聚类。

(3)对五个变量进行聚类。

第六章判别分析

1.判别分析是要解决在研究对象已_________________的情况下,确定新的观测数据属于已知类别中哪一类的多元统计方法。

2.用判别分析方法处理问题时,通常以__________作为衡量新样本点与各已知组别接近程度的指标。

3.进行判别分析时,通常指定一种判别规则,用来判定新样本的归属,常见的判别准则有____________、_____________。

4.在p维空间Rp中,点与点之间的接近和疏远尺度用_________来衡量,最简单的就是__________或_______________________。

5.类内样本点接近,类间样本点疏远的性质,可以通过_____________与___________的大小差异表现出来,而两者的比值能把不同的类区别开来。

这个比值越大,说明类与类间的差异越_____,分类效果越______。

6.Fisher判别法就是要找一个由p个变量组成的___________,使得各自组内点的______尽可能接近,而不同组间点的尽可能疏远。

1.判别分析的分类。

2.判别的基本思想。

3.简述两个类别的判别及判别准则。

4.简述Fisher判别规则及具体判别步骤。

5.简述逐步判别基本原理。

1.某地区将农村经济类型分为三类:

G1—较富裕类型,G2—中等类型,G3—较贫困类型。

每种类型以五个指标为依据:

x1=土地生产率=农村社会总产值/总土地面积(百元/每亩),x2=劳动生产率=农村社会总产值/农村劳动力(百元/每个劳动力),x3=人均收入=农村经济纯收入/农业人口(百元/每人),x4=费用水平=总费用/总收入,x5=农村工业比重=农村工业产值/农村社会总产值。

每种类型分别有容量为n1=5,n2=8,n3=4的样本(每个个体以县为单位),其数据如下:

G1(较富裕)

X3

X4

X5

3.85

6.75

4.79

0.85

3.51

5.73

4.01

0.81

0.60

4.12

4.45

3.68

0.89

5.01

4.68

3.64

0.78

3.67

5.84

4.27

0.87

0.64

G2(中等)

3.61

4.05

2.65

0.90

0.45

3.65

3.74

2.86

4.11

4.13

0.93

2.98

3.69

2.90

3.21

3.55

3.13

0.88

2.87

3.78

2.60

0.94

0.39

3.35

3.81

2.71

0.95

0.38

4.00

2.97

G3(较贫困)

3.23

4.08

1.85

0.96

3.03

2.03

0.25

2.54

3.50

1.51

0.97

0.34

0.99

0.21

(1)试作费歇尔判别

(2)试以x3,x5为变量,建立三个类别的直线判别函数

(3)试以x1,x2,x3,x4,x5为变量,建立马氏距离判别函数

(4)进行逐步判别分

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 医药卫生 > 基础医学

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1