Matlab数据处理函数插值拟合回归分析.docx
《Matlab数据处理函数插值拟合回归分析.docx》由会员分享,可在线阅读,更多相关《Matlab数据处理函数插值拟合回归分析.docx(20页珍藏版)》请在冰豆网上搜索。
Matlab数据处理函数插值拟合回归分析
Matlab曲线拟合工具箱
zy搜集整理
1插值1
1.1一维插值interp11
1.2二维数据内插值interp23
1.3三维插值interp34
1.4快速Fourier算法作一维插值interpft5
1.5命令5griddata5
1.6三次样条数据插值spline6
1.7n维数据插值interpn7
1.8生成三位图形矩阵数据meshgrid8
1.9多维函数数据产生函数ndgrid8
2拟合9
2.1多项式曲线拟合ployfit9
2.2多项式曲线求值函数polyval10
2.3多项式曲线拟合的评价和置信区间函数polyconf10
2.4稳健回归函数robust11
2.5向自定义函数拟合nlinfit12
2.6拟合工具cftool13
3回归分析15
3.1多元线性回归分析函数regress15
1插值
Matlab中插值函数汇总和使用说明
1.1一维插值interp1
MATLAB中的插值函数为interp1,其调用格式为:
yi=interp1(x,y,xi,'method')
其中x,y为插值点,yi为在被插值点xi处的插值结果;x,y为向量,'method'表示采用的插值方法,MATLAB提供的插值方法有几种:
'method'是最邻近插值,'linear'线性插值;'spline'三次样条插值;'cubic'立方插值.缺省时表示线性插值
注意:
所有的插值方法都要求x是单调的,并且xi不能够超过x的范围。
例如:
在一天24小时内,从零点开始每间隔2小时测得的环境温度数据分别为
12,9,9,10,18,24,28,27,25,20,18,15,13,
推测中午12点(即13点)时的温度.
x=0:
2:
24;
y=[129910182428272520181513];
a=13;
y1=interp1(x,y,a,'spline')
结果为:
27.8725
若要得到一天24小时的温度曲线,则:
xi=0:
1/3600:
24;
yi=interp1(x,y,xi,'spline');
plot(x,y,'o',xi,yi)
命令1interp1
功能一维数据插值(表格查找)。
该命令对数据点之间计算内插值。
它找出一元函数f(x)在中间点的数值。
其中函数f(x)由所给数据决定。
x:
原始数据点
Y:
原始数据点
xi:
插值点
Yi:
插值点
格式
(1)yi=interp1(x,Y,xi)
返回插值向量yi,每一元素对应于参量xi,同时由向量x与Y的内插值决定。
参量x指定数据Y的点。
若Y为一矩阵,则按Y的每列计算。
yi是阶数为length(xi)*size(Y,2)的输出矩阵。
(2)yi=interp1(Y,xi)
假定x=1:
N,其中N为向量Y的长度,或者为矩阵Y的行数。
(3)yi=interp1(x,Y,xi,method)
用指定的算法计算插值:
’nearest’:
最近邻点插值,直接完成计算;
’linear’:
线性插值(缺省方式),直接完成计算;
’spline’:
三次样条函数插值。
对于该方法,命令interp1调用函数spline、ppval、mkpp、umkpp。
这些命令生成一系列用于分段多项式操作的函数。
命令spline用它们执行三次样条函数插值;
’pchip’:
分段三次Hermite插值。
对于该方法,命令interp1调用函数pchip,用于对向量x与y执行分段三次内插值。
该方法保留单调性与数据的外形;
’cubic’:
与’pchip’操作相同;
’v5cubic’:
在MATLAB5.0中的三次插值。
对于超出x范围的xi的分量,使用方法’nearest’、’linear’、’v5cubic’的插值算法,相应地将返回NaN。
对其他的方法,interp1将对超出的分量执行外插值算法。
(4)yi=interp1(x,Y,xi,method,'extrap')
对于超出x范围的xi中的分量将执行特殊的外插值法extrap。
(5)yi=interp1(x,Y,xi,method,extrapval)
确定超出x范围的xi中的分量的外插值extrapval,其值通常取NaN或0。
例1
>>x=0:
10;y=x.*sin(x);
>>xx=0:
.25:
10;yy=interp1(x,y,xx);
>>plot(x,y,'kd',xx,yy)
例2
>>year=1900:
10:
2010;
>>product=[75.99591.972105.711123.203131.669150.697179.323203.212226.505
249.633256.344267.893];
>>p1995=interp1(year,product,1995)
>>x=1900:
1:
2010;
>>y=interp1(year,product,x,'pchip');
>>plot(year,product,'o',x,y)
复制代码
插值结果为:
p1995=
252.9885
1.2二维数据内插值interp2
命令2interp2
功能二维数据内插值(表格查找)
格式
(1)ZI=interp2(X,Y,Z,XI,YI)
返回矩阵ZI,其元素包含对应于参量XI与YI(可以是向量、或同型矩阵)的元素,即Zi(i,j)←[Xi(i,j),yi(i,j)]。
用户可以输入行向量和列向量Xi与Yi,此时,输出向量Zi与矩阵meshgrid(xi,yi)是同型的。
同时取决于由输入矩阵X、Y与Z确定的二维函数Z=f(X,Y)。
参量X与Y必须是单调的,且相同的划分格式,就像由命令meshgrid生成的一样。
若Xi与Yi中有在X与Y范围之外的点,则相应地返回nan(NotaNumber)。
(2)ZI=interp2(Z,XI,YI)
缺省地,X=1:
n、Y=1:
m,其中[m,n]=size(Z)。
再按第一种情形进行计算。
(3)ZI=interp2(Z,n)
作n次递归计算,在Z的每两个元素之间插入它们的二维插值,这样,Z的阶数将不断增加。
interp2(Z)等价于interp2(z,1)。
(4)ZI=interp2(X,Y,Z,XI,YI,method)
用指定的算法method计算二维插值:
’linear’:
双线性插值算法(缺省算法);
’nearest’:
最临近插值;
’spline’:
三次样条插值;
’cubic’:
双三次插值。
例3:
>>[X,Y]=meshgrid(-3:
.25:
3);
>>Z=peaks(X,Y);
>>[XI,YI]=meshgrid(-3:
.125:
3);
>>ZZ=interp2(X,Y,Z,XI,YI);
>>surfl(X,Y,Z);holdon;
>>surfl(XI,YI,ZZ+15)
>>axis([-33-33-520]);shadingflat
>>holdoff
复制代码
例4:
>>years=1950:
10:
1990;
>>service=10:
10:
30;
>>wage=[150.697199.592187.625
179.323195.072250.287
203.212179.092322.767
226.505153.706426.730
249.633120.281598.243];
>>w=interp2(service,years,wage,15,1975)
复制代码
插值结果为:
w=
190.6288
复制代码
1.3三维插值interp3
命令3interp3
功能三维数据插值(查表)
格式
(1)VI=interp3(X,Y,Z,V,XI,YI,ZI)
找出由参量X,Y,Z决定的三元函数V=V(X,Y,Z)在点(XI,YI,ZI)的值。
参量XI,YI,ZI是同型阵列或向量。
若向量参量XI,YI,ZI是不同长度,不同方向(行或列)的向量,这时输出参量VI与Y1,Y2,Y3为同型矩阵。
其中Y1,Y2,Y3为用命令meshgrid(XI,YI,ZI)生成的同型阵列。
若插值点(XI,YI,ZI)中有位于点(X,Y,Z)之外的点,则相应地返回特殊变量值NaN。
(2)VI=interp3(V,XI,YI,ZI)
缺省地,X=1:
N,Y=1:
M,Z=1:
P,其中,[M,N,P]=size(V),再按上面的情形计算。
(3)VI=interp3(V,n)
作n次递归计算,在V的每两个元素之间插入它们的三维插值。
这样,V的阶数将不断增加。
interp3(V)等价于interp3(V,1)。
(4)VI=interp3(......,method)%用指定的算法method作插值计算:
‘linear’:
线性插值(缺省算法);
‘cubic’:
三次插值;
‘spline’:
三次样条插值;
‘nearest’:
最邻近插值。
说明在所有的算法中,都要求X,Y,Z是单调且有相同的格点形式。
当X,Y,Z是等距且单调时,用算法’*linear’,’*cubic’,’*nearest’,可得到快速插值。
例5
>>[x,y,z,v]=flow(20);
>>[xx,yy,zz]=meshgrid(.1:
.25:
10,-3:
.25:
3,-3:
.25:
3);
>>vv=interp3(x,y,z,v,xx,yy,zz);
>>slice(xx,yy,zz,vv,[69.5],[12],[-2.2]);shadinginterp;colormapcool
复制代码
1.4快速Fourier算法作一维插值interpft
命令4interpft
功能用快速Fourier算法作一维插值
格式
(1)y=interpft(x,n)
返回包含周期函数x在重采样的n个等距的点的插值y。
若length(x)=m,且x有采样间隔dx,则新的y的采样间隔dy=dx*m/n。
注意的是必须n≥m。
若x为一矩阵,则按x的列进行计算。
返回的矩阵y有与x相同的列数,但有n行。
(2)y=interpft(x,n,dim)
沿着指定的方向dim进行计算
1.5命令5griddata
功能数据格点
格式
(1)ZI=griddata(x,y,z,XI,YI)
用二元函数z=f(x,y)的曲面拟合有不规则的数据向量x,y,z。
griddata将返回曲面z在点(XI,YI)处的插值。
曲面总是经过这些数据点(x,y,z)的。
输入参量(XI,YI)通常是规则的格点(像用命令meshgrid生成的一样)。
XI可以是一行向量,这时XI指定一有常数列向量的矩阵。
类似地,YI可以是一列向量,它指定一有常数行向量的矩阵。
(2)[XI,YI,ZI]=griddata(x,y,z,xi,yi)
返回的矩阵ZI含义同上,同时,返回的矩阵XI,YI是由行向量xi与列向量yi用命令meshgrid生成的。
(3)[XI,YI,ZI]=griddata(.......,method)
用指定的算法method计算:
‘linear’:
基于三角形的线性插值(缺省算法);
‘cubic’:
基于三角形的三次插值;
‘nearest’:
最邻近插值法;
‘v4’:
MATLAB4中的griddata算法。
1.6三次样条数据插值spline
命令6spline
功能三次样条数据插值spline
格式
(1)yy=spline(x,y,xx)
对于给定的离散的测量数据x,y(称为断点),要寻找一个三项多项式y=p(x),以逼近每对数据(x,y)点间的曲线。
过两点(xi,yi)和(xi+1,yi+1)只能确定一条直线,而通过一点的三次多项式曲线有无穷多条。
为使通过中间断点的三次多项式曲线具有唯一性,要增加两个条件(因为三次多项式有4个系数):
a.三次多项式在点(xi,yi)处有:
p¢i(xi)=p¢i(xi);
b.三次多项式在点(xi+1,yi+1)处有:
p¢i(xi+1)=pi¢(xi+1);
c.p(x)在点(xi,yi)处的斜率是连续的(为了使三次多项式具有良好的解析性,加上的条件);
d.p(x)在点(xi,yi)处的曲率是连续的;
对于第一个和最后一个多项式,人为地规定如下条件:
①p¢1¢(x)=p¢2¢(x)
②p¢n¢(x)=p¢n¢-1(x)
上述两个条件称为非结点(not-a-knot)条件。
综合上述内容,可知对数据拟合的三次样条函数p(x)是一个分段的三次多项式:
ïïî
ïïí
ì
££
££
££
=
nnn+1
223
112
p(x)xxx
p(x)xxx
p(x)xxx
p(x)
LLLL
其中每段pi(x)都是三次多项式。
该命令用三次样条插值计算出由向量x与y确定的一元函数y=f(x)在点xx处的值。
若参量y是一矩阵,则以y的每一列和x配对,再分别计算由它们确定的函数在点xx处的值。
则yy是一阶数为length(xx)*size(y,2)的矩阵。
(2)pp=spline(x,y)
返回由向量x与y确定的分段样条多项式的系数矩阵pp,它可用于命令ppval、unmkpp的计算。
例6
对离散地分布在y=exp(x)sin(x)函数曲线上的数据点进行样条插值计算:
>>x=[024581212.817.219.920];y=exp(x).*sin(x);
>>xx=0:
.25:
20;
>>yy=spline(x,y,xx);
>>plot(x,y,'o',xx,yy)
复制代码
1.7n维数据插值interpn
命令7interpn
功能n维数据插值(查表)
格式
(1)VI=interpn(X1,X2,,,Xn,V,Y1,Y2,⋯,Yn)%返回由参量X1,X2,…,Xn,V确定的n元函数V=V(X1,X2,…,Xn)在点(Y1,Y2,…,Yn)处的插值。
参量Y1,Y2,…,Yn是同型的矩阵或向量。
若Y1,Y2,…,Yn是向量,则可以
是不同长度,不同方向(行或列)的向量。
它们将通过命令ndgrid生成同型的矩阵,再作计算。
若点(Y1,Y2,…,Yn)中有位于点(X1,X2,…,Xn)之外的点,则相应地返回特殊变量NaN。
VI=interpn(V,Y1,Y2,⋯,Yn)%缺省地,X1=1:
size(V,1),X2=1:
size(V,2),…,
Xn=1:
size(V,n),再按上面的情形计算。
VI=interpn(V,ntimes)%作ntimes次递归计算,在V的每两个元素之间插入它们的n维插值。
这样,V的阶数将不断增加。
interpn(V)
等价于interpn(V,1)。
VI=interpn(⋯,method)%用指定的算法method计算:
‘linear’:
线性插值(缺省算法);
‘cubic’:
三次插值;
‘spline’:
三次样条插值法;
‘nearest’:
最邻近插值算法。
1.8生成三位图形矩阵数据meshgrid
功能生成用于画三维图形的矩阵数据。
格式[X,Y]=meshgrid(x,y)将由向量x,y(可以是不同方向的)指定的区域[min(x),max(x),min(y),max(y)]用直线x=x(i),y=y(j)(i=1,2,…,length(x),j=1,2,…,length(y))进行划分。
这样,得到了length(x)*length(y)个点,
这些点的横坐标用矩阵X表示,X的每个行向量与向量x相同;这些点的纵坐标用矩阵Y表示,Y的每个列向量与向量y相同。
其中X,Y可用于计算二元函数z=f(x,y)与三维图形中xy平面矩形定义域的划分或
曲面作图。
[X,Y]=meshgrid(x)%等价于[X,Y]=meshgrid(x,x)。
[X,Y,Z]=meshgrid(x,y,z)%生成三维阵列X,Y,Z,用于计算三元函数v=f(x,y,z)或三维容积图。
例7
[X,Y]=meshgrid(1:
3,10:
14)
复制代码
计算结果为:
X=
123
123
123
123
123
Y=
101010
111111
121212
131313
141414
复制代码
1.9多维函数数据产生函数ndgrid
命令9ndgrid功能生成用于多维函数计算或多维插值用的阵列
格式[X1,X2,…,Xn]=ndgrid(x1,x2,…,xn)%把通过向量x1,x2,x3…,xn指定的区域转换为数组x1,x2,x3,…,xn。
这样,得到了length(x1)*length(x2)*…*length(xn)个点,这些点的第一维坐标用矩阵X1表
示,X1的每个第一维向量与向量x1相同;这些点的第二维坐标用矩阵X2表示,X2的每个第二维向量与向量x2相同;如此等等。
其中X1,X2,…,Xn可用于计算多元函数y=f(x1,x2,…,xn)以及多维插值命令用到的阵列。
[X1,X2,…,Xn]=ndgrid(x)%等价于[X1,X2,…,Xn]=ndgrid(x,x,…,x)
2拟合
2.1多项式曲线拟合ployfit
二、求解多项式曲线拟合函数ployfit
调用格式:
p=polyfit(x,y,n)
[p,s]=polyfit(x,y,n)
说明:
x,y为数据点,n为多项式阶数,p为幂次从高到低的多项式系数向量。
矩阵s用于生成预测值的误差估计。
(见下一函数polyval)
三、举例
例2:
由离散数据拟合出多项式。
x
0
.1
.2
.3
.4
.5
.6
.7
.8
.9
1
y
.3
.5
1
1.4
1.6
1.9
.6
.4
.8
1.5
2
程序:
x=0:
.1:
1;
y=[.3.511.41.61.9.6.4.81.52];
n=3;
p=polyfit(x,y,n)
xi=linspace(0,1,100);
z=polyval(p,xi);%多项式求值
plot(x,y,'o',xi,z,'k:
',x,y,'b')
legend('原始数据','3阶曲线')
结果:
p=16.7832-25.745910.9802-0.0035
多项式为:
16.7832x3-25.7459x2+10.9802x-0.0035
曲线拟合图形:
例3:
x=1:
20,y=x+3*sin(x)
程序:
x=1:
20;
y=x+3*sin(x);
p=polyfit(x,y,6)
xi=1inspace(1,20,100);
z=poyval(p,xi);%多项式求值函数
plot(x,y,’o’,xi,z,’k:
’,x,y,’b’)
legend(‘原始数据’,’6阶曲线’)
结果:
p=0.0000-0.00210.0505-0.59713.6472-9.729511.3304
图6阶曲线图10阶曲线
例4:
再用10阶多项式拟合
程序:
x=1:
20;
y=x+3*sin(x);
p=polyfit(x,y,10)
xi=linspace(1,20,100);
z=polyval(p,xi);
plot(x,y,'o',xi,z,'k:
',x,y,'b')
legend('原始数据','10阶多项式')
结果:
p=Columns1through7
0.0000-0.00000.0004-0.01140.1814-1.806511.2360
Columns8through11
-42.086188.5907-92.815540.2671
说明:
可用不同阶的多项式来拟合数据,但也不是阶数越高拟合的越好。
2.2多项式曲线求值函数polyval
调用格式:
y=polyval(p,x)
[y,DELTA]=polyval(p,x,s)
说明:
y=polyval(p,x)为返回对应自变量x在给定系数P的多项式的值。
[y,DELTA]=polyval(p,x,s)使用polyfit函数的选项输出s得出误差估计Y
DELTA。
它假设polyfit函数数据输入的误差是独立正态的,并且方差为常数。
则Y
DELTA将至少包含50%的预测值。
2.3多项式曲线拟合的评价和置信区间函数polyconf
调用格式:
[Y,DELTA]=polyconf(p,x,s)
[Y,DELTA]=polyconf(p,x,s,alpha)
说明:
[Y,DELTA]=polyconf(p,x,s)使用polyfit函数的选项输出s给出Y的95%置信区间Y
DELTA。
它假设polyfit函数数据输入的误差是独立正态的,并且方差为常数。
1-alpha为置信度。
例5:
给出上面例1的预测值及置信度为90%的置信区间。
程序:
x=0:
.1:
1;
y=[.3.511.41.61.9.6.4.81.52]
n=3;
[p,s]=polyfit(x,y,n)
alpha=0.05;
[Y,DELTA]=polyconf(p,x,s,alpha)
结果:
p=16.7832-25.745910.9802-0.0035
s=R:
[4x4double]
df:
7
normr:
1.1406
Y=Columns1through7
-0.00350.85381.29701.42661.34341.14800.9413
Columns8through11
0.82380.89631.25942.0140
DELTA=Columns1through7