A题思路之一多元非线性回归分析Word格式文档下载.docx

上传人:b****7 文档编号:21863046 上传时间:2023-02-01 格式:DOCX 页数:10 大小:128.71KB
下载 相关 举报
A题思路之一多元非线性回归分析Word格式文档下载.docx_第1页
第1页 / 共10页
A题思路之一多元非线性回归分析Word格式文档下载.docx_第2页
第2页 / 共10页
A题思路之一多元非线性回归分析Word格式文档下载.docx_第3页
第3页 / 共10页
A题思路之一多元非线性回归分析Word格式文档下载.docx_第4页
第4页 / 共10页
A题思路之一多元非线性回归分析Word格式文档下载.docx_第5页
第5页 / 共10页
点击查看更多>>
下载资源
资源描述

A题思路之一多元非线性回归分析Word格式文档下载.docx

《A题思路之一多元非线性回归分析Word格式文档下载.docx》由会员分享,可在线阅读,更多相关《A题思路之一多元非线性回归分析Word格式文档下载.docx(10页珍藏版)》请在冰豆网上搜索。

A题思路之一多元非线性回归分析Word格式文档下载.docx

,2);

y=data(:

1);

x=data(:

2:

8);

plot(x(:

2),y,'

r*'

title('

lnyvsx2'

3)相关性分析

s=corrcoef(data);

xlswrite('

coef.xls'

s)

lny

X1

X2

X3

X4

X5

X6

X7

3.6623常数项

0.0044x1

0.0016x2

-0.0010x3

0.1713x4

0.0170x5

-0.0012x6

0.0143x7

Bint(系数95%置信区间)=

3.59573.7289

-0.08280.0917

0.00140.0019

-0.09300.0910

0.08490.2577

-0.05360.0876

-0.07980.0773

-0.12540.1540

置信区间包含零点,可认为在95%置信度下,相应变量对y影响不显著,应该考虑改进模型。

stats(统计量)=

0.7852(决定系数)42.8304(F值)0(P值)0.0193

关于异常值:

利用上述多元线性回归模型分析结果,继续做异常点分析,

rcoplot(r,rint)

发现5个异常点:

4352606190

从原始数据中将其剔除后,重新做多元线性回归,

源程序:

4);

Y=data(:

X=[ones(85,1),x];

[b,bint,r,rint,stats]=regress(Y,X);

b,bint,stats

结果

b=

3.6502

0.0055

0.0017

-0.0282

0.1752

0.0188

-0.0076

0.0330

bint=

3.59493.7055

-0.06880.0798

0.00150.0019

-0.10560.0493

0.10260.2477

-0.04060.0782

-0.07390.0587

-0.08800.1539

stats=

0.852663.607100.0132

可见决定系数与F值均提高!

2)线性逐步回归结果(考虑采用逐步回归方法)

stepwise(x,y);

系数:

beta=

0

0

0.1926

系数95%置信区间:

betaci=

00

00

0.15660.2287

统计量

stats=

intercept:

3.6449(常数项)

rmse:

0.1124

rsq:

0.8495(决定系数)

adjrsq:

0.8440

fstat:

231.4507(F值)

pval:

0(P值)

较多元线性模型相比,尽管决定系数略有下降,但F值上升很快,逐步回归整体效果优于多元线性模型。

3)多元非线性回归(含平方项、交叉项)

模型:

y=a+b*x2+c*x2^2+d*x4+e*x5*x6

(仅为一特例,考虑工资可能与x5,x6有一定的关系。

另外其他组合较多,留给大家更多思考空间!

%rstool(x,y,'

quadratic'

X=[ones(85,1)x(:

2),x(:

2).^2,x(:

4),x(:

5).*x(:

6)];

[b,bint,r,rint,stats]=regress(y,X);

3.5285

0.0038

-0.00000505057598

0.1629

0.0300

3.48413.5730

0.00320.0043

-0.00000638020871-0.00000372094326

0.13070.1950

-0.04120.1011(包含零点)

0.9122(决定系数)207.8439(F值)0(P值)0.0075

可见上述交叉项对y影响不够显著,考虑剔除。

4)多元非线性回归(仅含平方项)

y=a+b*x2+c*x2^2+d*x4

4)];

结果:

3.5282

-0.00000499497561

0.1691

3.48393.5726

-0.00000631534196-0.00000367460927

0.14060.1976

0.9115(决定系数)277.9148(F值)0(P值)0.0075

本模型较带交叉项模型决定系数减小,但是系数95%置信区间均显示各变量对y影响显著,并且F大幅提升,因此最终选择模型如下:

特别注意:

本问题可能还有更加优秀的模型及结果!

3、第二问

关于女工是否受到不公正待遇,以及她们的婚姻状况是否影响其收入,可以从以下几个角度之一考虑:

y与x3相关系数;

逐步回归结果中剔除了x1和x3;

也可采用单因素方差分析考虑。

其他做法。

**********************完!

****************************

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 初中教育

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1