实验四异方差性的检验与处理Word格式.docx

上传人:b****6 文档编号:20882667 上传时间:2023-01-26 格式:DOCX 页数:13 大小:193.77KB
下载 相关 举报
实验四异方差性的检验与处理Word格式.docx_第1页
第1页 / 共13页
实验四异方差性的检验与处理Word格式.docx_第2页
第2页 / 共13页
实验四异方差性的检验与处理Word格式.docx_第3页
第3页 / 共13页
实验四异方差性的检验与处理Word格式.docx_第4页
第4页 / 共13页
实验四异方差性的检验与处理Word格式.docx_第5页
第5页 / 共13页
点击查看更多>>
下载资源
资源描述

实验四异方差性的检验与处理Word格式.docx

《实验四异方差性的检验与处理Word格式.docx》由会员分享,可在线阅读,更多相关《实验四异方差性的检验与处理Word格式.docx(13页珍藏版)》请在冰豆网上搜索。

实验四异方差性的检验与处理Word格式.docx

例1、某地区居民的可支配收入x(千元)与居民消费支出y(千元)的数据如下:

No

x

y

no

1

10

8

16

25

19.1

2

8.2

17

23.5

3

8.3

18

22.4

4

8.1

19

23.1

5

8.7

20

15.1

6

15

12.3

21

30

24.2

7

9.4

22

16.7

11.6

23

27

9

12

24

26

8.9

22.1

11

35

30.5

28.7

13

28

31.1

14

29

29.9

,研究不同收入家庭的消费情况,试问原数据有无异方差性?

如果存在异方差性,应如何处理?

解:

(一)编写程序如下:

(1)等级相关系数法(详见test4_1.m文件)

%%%%%%%%%%%%%%%用等级相关系数法来检验异方差性%%%%%%%%

[data,head]=xlsread('

test4.xlsx'

);

x=data(:

1);

%提取第一列数据,即可支配收入x

y=data(:

2);

%提取第二列数据,即居民消费支出y

plot(x,y,'

k.'

%画x和y的散点图

xlabel('

可支配收入x(千元)'

)%对x轴加标签

ylabel('

居民消费支出y(千元)'

)%对y轴加标签

%%%%%%%%调用regres函数进行一元线性回归%%%%%%%%%%%%

xdata=[ones(size(x,1),1),x];

%在x矩阵最左边加一列1,为线性回归做准备

[b,bint,r,rint,s]=regress(y,xdata);

yhat=xdata*b;

%计算估计值y

%定义元胞数组,以元胞数组形式显示系数的估计值和估计值的95%置信区间

head1={'

系数的估计值'

'

估计值的95%置信下限'

估计值的95%置信上限'

};

[head1;

num2cell([b,bint])]

%定义元胞数组,以元胞数组形式显示y的真实值,y的估计值,残差和残差的95%置信区间

head2={'

y的真实值'

y的估计值'

残差'

残差的95%置信下限'

残差的95%置信上限'

[head2;

num2cell([y,yhat,r,rint])]

%定义元胞数组,以元胞数组形式显示判定系数,F统计量的观测值,检验的P值和误差方差的估计值

head3={'

判定系数'

F统计量的观测值'

检验的P值'

误差方差的估计值'

[head3;

num2cell(s)]

%%%%%%%%%%%%%残差分析%%%%%%%%%%%%%%%%%%

figure;

rcoplot(r,rint)%按顺序画出各组观测值对应的残差和残差的置信区间

%%%画估计值yhat与残差r的散点图

plot(yhat,r,'

)%画散点图

估计值yhat'

残差r'

%%%%%%%%%%%%调用corr函数计算皮尔曼等级相关系数

res=abs(r);

%对残差r取绝对值

[rs,p]=corr(x,res,'

type'

spearman'

disp('

其中rs为皮尔曼等级相关系数,p为p值'

(2)帕克(park)检验法(详见test4_2.m文件)

%%%%%%%%%%%%%%%用帕克(park)检验法来检验异方差性%%%%%%%[data,head]=xlsread('

%导入数据

%%%%%%调用regstats函数进行一元线性回归,linear表带有常数项的线性模型,r表残差

ST=regstats(y,x,'

linear'

{'

yhat'

r'

standres'

});

scatter(x,(ST.r).^2)%画x与残差平方的散点图

可支配收入(x)'

残差的平方'

)%对y轴加标签

%%%%%%%对原数据x和残差平方r^2取对数,并对log(x)和log(r^2)进行一元线性回归

ST1=regstats(log((ST.r).^2),log(x),'

beta'

tstat'

fstat'

})

ST1.tstat.beta%输出参数的估计值

ST1.tstat.pval%输出回归系数t检验的P值

ST1.fstat.pval%输出回归模型显著性检验的P值

(3)加权最小二乘法(详见test4_3.m文件)

%%%%%%%%%%%调用robustfit函数作稳健回归%%%%%%%%%%%%

%导入数据

%调用robustfit函数作稳健回归,返回系数的估计值b和相关统计量stats

[b,stats]=robustfit(x,y)%调用函数作稳健回归

stats.p%输出模型检验的P值

%%%绘制残差和权重的散点图%%%%%%%

plot(stats.resid,stats.w,'

o'

)%绘制残差和权重的散点图

权重'

(二)实验结果与分析:

第一步:

用OLS方法估计参数,并保留残差

(1)散点图

图4.1可支配收入(x)居民消费支出(y)散点图

因每个可支配收入x的值,都有5个居民消费收入y与之对应,所以上述散点图呈现此形状。

(2)回归模型参数估计值与显著性检验

表1

'

[-0.5390][-3.7241][2.6460]

[0.8091][0.6768][0.9415]

[0.8485][156.8387][5.4040e-13][9.1316]

由输出结果看,常数项和回归系数的估计值分别为-0.539和0.8091,从而可以写出线性回归方程为

回归系数的估计值的95%置信区间为[0.6768,0.9415]。

对回归直线进行显著性检验,原假设和对立假设分别为

检验的P值为

可知在显著性水平

下应拒绝原假设

,可认为y(居民消费收入)与x(可支配收入)的线性关系是显著的。

(3)方差分析

图4.2原始数据对应残差图

从残差图可以看到有2条线段(红色虚线)与水平线y=0没有交点,它对应的观测号为22和29,也就是说这两组观测对应的残差的置信区间不包含0点,可认为这两组观测数据为异常数据。

它们分别是(30,16.7),(35,20)。

第二步:

异方差性检验

(1)图示法

图4.3

(2)等级相关系数法

在y与x的OLS回归的基础上计算出残差的绝对值,并记为res,并计算出皮尔曼等级相关系数rs=0.4860与对应的p值为0.0065<

0.05(*),说明残差r与x存在系统关系,即存在异方差问题。

(3)帕克(Park)检验法

1)散点图

图4.4可支配收入与残差平方的散点图

从图4.4可知,可考虑拟合指数曲线。

现将其取对数,即可进行一元线性拟合。

2)回归系数与模型检验

做ln(r^2)对ln(x)回归,得到

表2

‘回归系数’回归系数t检验的P值显著性检验P值

=-8.49730.02950.0207

=2.96790.0207

从上表可以看出,得到的回归模型为ln

,常数项和线性项的t检验的P值均小于0.05,说明回归方程中常数项和线性项均是显著的。

并且,检验的P值为0.0207小于0.05,说明整个回归方程是显著的,表明存在异方差性。

综上所述,通过以上3种方法的检验,我们得到原数据存在异方差性。

第三步:

用加权最小二乘法处理异方差性

表3

‘回归系数’回归系数t检验的P值

=-1.60910.2375

=0.88700.0000

由表3得:

回归方程为

,由p值可知x的回归系数是显著的,常数项未显著,说明其无实际意义。

图4.5残差和权重的散点图

由图4.5知:

权重集中在最上方的1附近的点比较多,说明稳健性比较好。

六、实验内容

下表是我国各地区2003年FDI和GDP的数据,

项目

2003年FDI(万美元)

2003GDP(亿元)

北京

219126

3663.10

河南

53903

7048.59

天津

153473

2447.66

湖北

156886

5401.71

河北

96405

7098.56

湖南

101835

4638.73

山西

21361

2456.59

广东

782294

13625.87

内蒙

8854

2150.41

广西

41856

2735.13

辽宁

282410

6002.54

海南

42125

670.93

吉林

19059

2522.62

重庆

26083

2250.56

黑龙江

32180

4430.00

四川

41231

5456.32

上海

546849

6250.81

贵州

4521

1356.11

江苏

1056365

12460.83

云南

8384

2465.29

浙江

498055

9395.00

陕西

33190

2398.58

安徽

36720

3972.38

甘肃

2342

1304.60

福建

259903

5232.17

青海

2522

390.21

江西

161202

2830.46

宁夏

1743

385.34

山东

601617

12435.93

新疆

1534

1877.61

,研究不同地区FDI和GDP的关系,试问原数据有无异方差性?

七、思考练习

某地区家庭年收入(x)和每年生活必需品综合支出(y)的样本数据如下表:

0.8

2.4

1.5

1.2

2.7

2.1

1.4

0.9

1.6

3.3

2.2

1.8

3.5

3.8

2.3

1.7

3.2

现用线性模型

,研究不同收入水平家庭的消费情况,试问原数据有无异方差性?

八、参考文献

[1].李宝仁.计量经济学[M].机械工业出版社,2007.12

[2].何晓群.应用回归分析[M].中国人民大学出版,2002.9

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 经管营销 > 企业管理

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1