各种线性回归模型原理.docx
《各种线性回归模型原理.docx》由会员分享,可在线阅读,更多相关《各种线性回归模型原理.docx(10页珍藏版)》请在冰豆网上搜索。
各种线性回归模型原理
一元线性回归
一元线性回归模型的一般形式:
)心几+0戸+£
一元线性回归方程为:
E(y)=0()+0/
当对丫与X进行n次独立观测后,可取得n对观测值
(石j)J=l,2,…”则有y(=0。
+0內+6
回归分析的主要任务是通过n组样木观测值(兀j),i=12…”对00,人进行估计。
一般用幺分别表示几,A的估计值。
称y=p^pxx为y关于X的一元线性回归方程(简称为回归直线方程),疵为截距,人为经验回归直线的斜率。
引进矩阵的形式:
则一元线性回归模型可表示为:
y=Xp+£
其中人为川阶单位阵。
为了得到0",A更好的性质,我们对S给出进一步的假设(强假设)
设引£”・・&「相互独立,且®~N(0d)(=12…由此可得:
…,儿相互独立,且兀~N(0°+0Z/),(,=12…曲)
x=[];y二[];
多元线性回归
实际问题中的随机变量y通常与多个普通变量(P>1)有
关。
对于自变量"勺,…©的一组确定值,丫具有一定的分布,若丫的数学期望值存在,则它是y关于册,吃,…©的函数。
F心內,•••,©)
“(X],X2,…宀)是册‘2,…©的线性函数。
Y=bo+b$+・・・+bpXp+&£〜NQa2)
勺,仇,•••£,,cH是与£宀,…Xp无关的未知参数。
逐步回归分析
逐步回归分析的数学模型是指仅包含对因变量Y有显著影响自变量的多元线性回归方程。
为了利于变换求算和上机计算,将对其变量进行重新编号并对原始数据进行标准化处理。
一、变量重新编号
1、新编号数学模型
令儿=心,自变量个数为比-1,则其数学模型为:
Xak=00+P\xa\+PlXa2++…+Pk-\XOc-\
式中,a=l,2,3,…/(其中“为样本个数)
Su=工(九-耳)'
S严S—S严工怎一无)2
Xj的偏回归平方和为:
cii
Xk:
为心的算术平均值
b}:
Xj的偏回归系数
5:
为逆矩阵口对角线对应元素
2回归数学模型
新编号的回归数学模型为:
xk=bQ++b2x2+b3x3+...+b—x—i
二、标准化数学模型
标准化回归数学模型是指将原始数据进行标准化处理后而建立的回归数学模型,即实质上是每个原始数据减去平均值后再除以离差平方和的方根。
1、标准化回归数学模型
令j二1,2,3,…,k
其中:
耳=丄^xaj
“a^\
S广血=悴二齐!
为离差平方和的方根
注意:
5,氏&宀它们之间的区别,即离差平方和,离差平方和的方根,方差,标准差。
则回归数学模型为:
2、标准化回归数学模型的正规方程组
标准化回归数学模型正规方程组的一般形式为:
nK+(E如)0;+(EJ)0;+(ZZa3)0;+•••+(Es)0;」=EQ
(Es浪+(E蠹)0;+(Es%;+(E%°)禹+•••+(S—.J0爲=E%%(2>必)观+(工"1“2)0;+(工成2)0;+反“2“3)0;+•••+(》S2Za_j0;“
(工3)0:
+(工Si«a3)0;+(工JZa3)0;+(工忌)0;+・・・+(》)0l=E
(工S|)0:
+(工)0;+(工)0;+反)0;+・・・+(》Z:
—i)0;-i=工'a&・】
所以上述正规方程组可变为:
门0:
+0+0+0+•・・+0=0
°+50:
+巾0;+斤30;+・•・+g";7=心
0+唧;+M;+「230;+…+S0;7=F°+勺A'+F0;+勺0;+・•・+S-I0;T=r3k°+也|0;+也屛+也30;+…+也10:
・1F亠
这样,数据标准化处理后的估计值0,并令,则可得数据标准化处理后的回归方程数学模型的正规方程组的一般形式为:
50:
+巾0;+60;+••・+5
□P;+厂220;+『230;+•••+r2k-\P'k-X=r2k勺0;+『32卩;+『33卩;+・••+□k-\卩;-\=r3*
这样,数据标准化后0(;的估计值应为0,并0;=心令,则可得:
r[}dl+rnd2+rnd3=rlk
r2\d\+厂22〃2+厂23〃3+・・・+厂2"1〃11=厂和r3xdx+rnd2+r33d3+…=i
耳丄仏+Nt2心+耳-13〃3+・・・+,Li心T=r“
rilri2…rU-l
•G・
其中g
r2122…r2k-\
••••••••••••
称为相关系数矩阵。
B=
r2k
<^-117-12・・•7-U-l丿
解此方程组,即可求出心心心…g,故可得标准化后的回归模型为:
乙=〃忆]+d?
s+...+dS-、
标准化的回归模型的矩阵形式:
旺2-元2
X\k-\-耳-1
切-石
也2局
“耳-|
S|
52
勺|-召
心2-壬2
X3k-\"-1
S?
-召
©2-无2
S-元一
52
1
1
1
1
Sk
n
0
A=XX=
0
三、标准化前后回归模型的关系
1、标准化前后的回归模型
1)标准化前后回归模型为:
xk=bQ++b2x2+b3x3+...+bk^xxk^
2)标准化后回归模型为:
=〃忆I+〃2?
2+—+
2、标准化前后的偏回归系数
标准化前后偏回归系数的关系可从变化过程反演得知:
令®=亠土代入标准化前的回归模型可得:
sj
rv】C1•-C9A—If
6dld2
整理后得:
xk=b{)+勺“+b2x2+b3x3+...+
将上式与标准化前的回归模型作比较,由待定系数法可知标准化
前后回归模型的偏回归系数的关系为:
j=l,2,3,—k-1
于是只要求出即可求出◎,今后仅讨论标准化后的回归模型。
3、标准化后的各种离差平方和
SQ=*Sq
中多元回归分析的实现:
1.确定回归系数的点估计值,用命令
b二regresslY、X)
2.求回归系数的点估计和区间估计,并检验回
归模型,用命令:
[Z?
bint、r,rintystats\=regress(Y,X,alpha)
3.画出残差及其置信区间,用命令:
rcoplotrint)
1£1£2•…f
y=
)'2
■
■
■
b=B=
A
%
A
■
■
■
=(X'X\X'Y
A
h
p
⑵alpha为显著性水平,默认为0.05;
(3)方力^为回归系数的区间估计;
(4)厂与门分别为残差及其置信区间;
(5)stats是用于检验回归模型的统计量,有三个数值,第一个是相关系数厂2,其值越接近于1,说明回归方程越显著;第二个是尸值,F>Fl-alpha(p,n~p~\)时拒绝仏,尸越大,说明回归方程越显著;第三个是与尸对应的概率p,pMATLAB中各种回归分析的实现
(1)多元线性回归
b=regress{Y,X)
(2)—元多项式回归
[qS]=polyfit(尤/ni)
(3)多元二项式回归
rstool^x,y,'model',alpha)
(4)逐步回归分析
stepwise(x,y,inmodel,alpha)
程序:
x=[];X=[ones(n,1),x];Y=[];
回归分析检验
[b,bint,r,rint,stats]二regress(Y,X);
b,bint,stats
残差分析
rcoplot(r,rint)
预测及作图
z二b(l)+b
(2)*x
plot(x,Y,k+‘,x,z,Jr*)
逐步回归分析:
例:
水泥凝固时放出的热量y与水泥中4种化学成分xl、x2、x3、x4有关,今测得一组数据如下,试用逐步回归法确定一个线性模型.
(1)数据输入:
(2)
11110]';
xl二[71111171131221
x4二[605220
y二[78.574.3
4733226442226341212]';
104.387.695.9109.2102.772.593.1115.983.8113.3109.4]';
X二[xlx2x3x4];
(3)①先在初始模型中取全部自变量:
stepwise(x,y)
得图StepwisePlot和表StepwiseTable・
图StepwisePlot中四条直线都是虚线,说明模型的显著性不好.
ConfidenceIntervals
Colurrin#
Par^me-ter
Lower
Uppe-f
1
1.551
-0.5319
3.934
2
0.5102
-1.806
2.826
3
0.1019
•2.313
2.51?
4
•0.1441
•2.413
2.125
EMSE
E-square
F
P
24装
0.9424
111.5
4.75te-C
从表StepwiseTable中看出变量x3和x4的显著性最差.
②在图StepwisePlot中点击直线3和直线4,移去变量x3和x4.
移去变量x3和x4后模型具有显著性
ConfidenteIntervals
Column
Lower
Uf-per
1
1.4t8
1.1
l.«3«
2
Q6623
0.5232
0.8013
3
0.25
-0.3235
0.8236
4
•0.2365
-0.7746
0.3015
BMSE
R-square
F
F
2.406
0.9787
229.5
4.407"
|Close
■
■
Help
虽然剩余标准差(RMSE)没有太大的变化,但是统计量F的值明显增大,因此新的回归模型更好.
(4)对变量y和xl、x2作线性回归.
X=[ones(13,1)xlx2];
b=regress(y,X)
得结果:
b-
52.5773
1.4683
0.6623
故最终模型为:
y二52.5773+1.4683x1+0.6623x2
(注:
素材和资料部分来自网络,供参考。
请预览后才下载,期待你的好评与关注!
)