实验四异方差性的检验与处理.docx

上传人:b****6 文档编号:7756066 上传时间:2023-01-26 格式:DOCX 页数:13 大小:193.77KB
下载 相关 举报
实验四异方差性的检验与处理.docx_第1页
第1页 / 共13页
实验四异方差性的检验与处理.docx_第2页
第2页 / 共13页
实验四异方差性的检验与处理.docx_第3页
第3页 / 共13页
实验四异方差性的检验与处理.docx_第4页
第4页 / 共13页
实验四异方差性的检验与处理.docx_第5页
第5页 / 共13页
点击查看更多>>
下载资源
资源描述

实验四异方差性的检验与处理.docx

《实验四异方差性的检验与处理.docx》由会员分享,可在线阅读,更多相关《实验四异方差性的检验与处理.docx(13页珍藏版)》请在冰豆网上搜索。

实验四异方差性的检验与处理.docx

实验四异方差性的检验与处理

实验四异方差性的检验及处理(2学时)

一、实验目的

(1)、掌握异方差检验的基本方法;

(2)、掌握异方差的处理方法。

二、实验学时:

2学时

三、实验要求

(1)掌握用MATLAB软件实现异方差的检验和处理;

(2)掌握异方差的检验和处理的基本步骤。

四、实验原理

1、异方差检验的常用方法

(1)用X-Y的散点图进行判断

(2).

(3)等级相关系数法(又称Spearman检验)

是一种应用较广的方法,既可以用于大样本,也可与小样本。

检验的三个步骤

计算Spearman系数rs,其中:

③做等级相关系数的显著性检验。

n>8时,

异方差问题存在。

(4)帕克(Park)检验

帕克检验常用的函数形式:

若在统计上是显著的,表明存在异方差性。

2、异方差性的处理方法:

加权最小二乘法

如果在检验过程中已经知道:

则将原模型变形为:

在该模型中:

即满足同方差性。

于是可以用OLS估计其参数,得到关于参数

的无偏、有效估计量。

五、实验举例

例1、某地区居民的可支配收入x(千元)与居民消费支出y(千元)的数据如下:

No

x

y

no

x

y

1

10

8

16

25

19.1

2

10

8.2

17

25

23.5

3

10

8.3

18

25

22.4

4

10

8.1

19

25

23.1

5

10

8.7

20

25

15.1

6

15

12.3

21

30

24.2

7

15

9.4

22

30

16.7

8

15

11.6

23

30

27

9

15

12

24

30

26

10

15

8.9

25

30

22.1

11

20

15

26

35

30.5

12

20

16

27

35

28.7

13

20

12

28

35

31.1

14

20

13

29

35

20

15

20

19.1

30

35

29.9

,研究不同收入家庭的消费情况,试问原数据有无异方差性?

如果存在异方差性,应如何处理?

解:

(一)编写程序如下:

(1)等级相关系数法(详见test4_1.m文件)

%%%%%%%%%%%%%%%用等级相关系数法来检验异方差性%%%%%%%%

[data,head]=xlsread('test4.xlsx');

x=data(:

1);%提取第一列数据,即可支配收入x

y=data(:

2);%提取第二列数据,即居民消费支出y

plot(x,y,'k.');%画x和y的散点图

xlabel('可支配收入x(千元)')%对x轴加标签

ylabel('居民消费支出y(千元)')%对y轴加标签

%%%%%%%%调用regres函数进行一元线性回归%%%%%%%%%%%%

xdata=[ones(size(x,1),1),x];%在x矩阵最左边加一列1,为线性回归做准备

[b,bint,r,rint,s]=regress(y,xdata);

yhat=xdata*b;%计算估计值y

%定义元胞数组,以元胞数组形式显示系数的估计值和估计值的95%置信区间

head1={'系数的估计值','估计值的95%置信下限','估计值的95%置信上限'};

[head1;num2cell([b,bint])]

%定义元胞数组,以元胞数组形式显示y的真实值,y的估计值,残差和残差的95%置信区间

head2={'y的真实值','y的估计值','残差','残差的95%置信下限','残差的95%置信上限'};

[head2;num2cell([y,yhat,r,rint])]

%定义元胞数组,以元胞数组形式显示判定系数,F统计量的观测值,检验的P值和误差方差的估计值

head3={'判定系数','F统计量的观测值','检验的P值','误差方差的估计值'};

[head3;num2cell(s)]

%%%%%%%%%%%%%残差分析%%%%%%%%%%%%%%%%%%

figure;

rcoplot(r,rint)%按顺序画出各组观测值对应的残差和残差的置信区间

%%%画估计值yhat与残差r的散点图

figure;

plot(yhat,r,'k.')%画散点图

xlabel('估计值yhat')%对x轴加标签

ylabel('残差r')%对y轴加标签

%%%%%%%%%%%%调用corr函数计算皮尔曼等级相关系数

res=abs(r);%对残差r取绝对值

[rs,p]=corr(x,res,'type','spearman')

disp('其中rs为皮尔曼等级相关系数,p为p值');

(2)帕克(park)检验法(详见test4_2.m文件)

%%%%%%%%%%%%%%%用帕克(park)检验法来检验异方差性%%%%%%%[data,head]=xlsread('test4.xlsx');%导入数据

x=data(:

1);

y=data(:

2);

%%%%%%调用regstats函数进行一元线性回归,linear表带有常数项的线性模型,r表残差

ST=regstats(y,x,'linear',{'yhat','r','standres'});

scatter(x,(ST.r).^2)%画x与残差平方的散点图

xlabel('可支配收入(x)')%对x轴加标签

ylabel('残差的平方')%对y轴加标签

%%%%%%%对原数据x和残差平方r^2取对数,并对log(x)和log(r^2)进行一元线性回归

ST1=regstats(log((ST.r).^2),log(x),'linear',{'r','beta','tstat','fstat'})

ST1.tstat.beta%输出参数的估计值

ST1.tstat.pval%输出回归系数t检验的P值

ST1.fstat.pval%输出回归模型显著性检验的P值

(3)加权最小二乘法(详见test4_3.m文件)

%%%%%%%%%%%调用robustfit函数作稳健回归%%%%%%%%%%%%

[data,head]=xlsread('test4.xlsx');%导入数据

x=data(:

1);

y=data(:

2);

%调用robustfit函数作稳健回归,返回系数的估计值b和相关统计量stats

[b,stats]=robustfit(x,y)%调用函数作稳健回归

stats.p%输出模型检验的P值

%%%绘制残差和权重的散点图%%%%%%%

plot(stats.resid,stats.w,'o')%绘制残差和权重的散点图

xlabel('残差')

ylabel('权重'

(二)实验结果与分析:

第一步:

用OLS方法估计参数,并保留残差

(1)散点图

图4.1可支配收入(x)居民消费支出(y)散点图

因每个可支配收入x的值,都有5个居民消费收入y与之对应,所以上述散点图呈现此形状。

(2)回归模型参数估计值与显著性检验

表1

'系数的估计值''估计值的95%置信下限''估计值的95%置信上限'

[-0.5390][-3.7241][2.6460]

[0.8091][0.6768][0.9415]

'判定系数''F统计量的观测值''检验的P值''误差方差的估计值'

[0.8485][156.8387][5.4040e-13][9.1316]

由输出结果看,常数项和回归系数的估计值分别为-0.539和0.8091,从而可以写出线性回归方程为

回归系数的估计值的95%置信区间为[0.6768,0.9415]。

对回归直线进行显著性检验,原假设和对立假设分别为

检验的P值为

可知在显著性水平

下应拒绝原假设

,可认为y(居民消费收入)与x(可支配收入)的线性关系是显著的。

(3)方差分析

图4.2原始数据对应残差图

从残差图可以看到有2条线段(红色虚线)与水平线y=0没有交点,它对应的观测号为22和29,也就是说这两组观测对应的残差的置信区间不包含0点,可认为这两组观测数据为异常数据。

它们分别是(30,16.7),(35,20)。

第二步:

异方差性检验

(1)图示法

图4.3

(2)等级相关系数法

在y与x的OLS回归的基础上计算出残差的绝对值,并记为res,并计算出皮尔曼等级相关系数rs=0.4860与对应的p值为0.0065<0.05(*),说明残差r与x存在系统关系,即存在异方差问题。

(3)帕克(Park)检验法

1)散点图

图4.4可支配收入与残差平方的散点图

从图4.4可知,可考虑拟合指数曲线。

现将其取对数,即可进行一元线性拟合。

2)回归系数与模型检验

做ln(r^2)对ln(x)回归,得到

表2

‘回归系数’回归系数t检验的P值显著性检验P值

=-8.49730.02950.0207

=2.96790.0207

从上表可以看出,得到的回归模型为ln

,常数项和线性项的t检验的P值均小于0.05,说明回归方程中常数项和线性项均是显著的。

并且,检验的P值为0.0207小于0.05,说明整个回归方程是显著的,表明存在异方差性。

综上所述,通过以上3种方法的检验,我们得到原数据存在异方差性。

第三步:

用加权最小二乘法处理异方差性

表3

‘回归系数’回归系数t检验的P值

=-1.60910.2375

=0.88700.0000

由表3得:

回归方程为

,由p值可知x的回归系数是显著的,常数项未显著,说明其无实际意义。

图4.5残差和权重的散点图

由图4.5知:

权重集中在最上方的1附近的点比较多,说明稳健性比较好。

六、实验内容

下表是我国各地区2003年FDI和GDP的数据,

项目

2003年FDI(万美元)

2003GDP(亿元)

项目

2003年FDI(万美元)

2003GDP(亿元)

北京

219126

3663.10

河南

53903

7048.59

天津

153473

2447.66

湖北

156886

5401.71

河北

96405

7098.56

湖南

101835

4638.73

山西

21361

2456.59

广东

782294

13625.87

内蒙

8854

2150.41

广西

41856

2735.13

辽宁

282410

6002.54

海南

42125

670.93

吉林

19059

2522.62

重庆

26083

2250.56

黑龙江

32180

4430.00

四川

41231

5456.32

上海

546849

6250.81

贵州

4521

1356.11

江苏

1056365

12460.83

云南

8384

2465.29

浙江

498055

9395.00

陕西

33190

2398.58

安徽

36720

3972.38

甘肃

2342

1304.60

福建

259903

5232.17

青海

2522

390.21

江西

161202

2830.46

宁夏

1743

385.34

山东

601617

12435.93

新疆

1534

1877.61

,研究不同地区FDI和GDP的关系,试问原数据有无异方差性?

如果存在异方差性,应如何处理?

七、思考练习

某地区家庭年收入(x)和每年生活必需品综合支出(y)的样本数据如下表:

x

y

x

y

1

0.8

2.4

1.5

1.2

0.8

2.7

2.1

1.4

0.9

3

2.4

1.6

1.2

3.3

2.2

1.8

1.4

3.5

2.1

2

1.2

3.8

2.3

2.2

1.7

4

3.2

现用线性模型

,研究不同收入水平家庭的消费情况,试问原数据有无异方差性?

如果存在异方差性,应如何处理?

八、参考文献

[1].李宝仁.计量经济学[M].机械工业出版社,2007.12

[2].何晓群.应用回归分析[M].中国人民大学出版,2002.9

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 小学教育 > 语文

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1