ImageVerifierCode 换一换
格式:DOCX , 页数:13 ,大小:55.23KB ,
资源ID:9364798      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/9364798.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(最小二乘法及其应用.docx)为本站会员(b****8)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

最小二乘法及其应用.docx

1、最小二乘法及其应用最小二乘法及其应用1.引言最小二乘法在19世纪初发明后,很快得到欧洲一些国家的天文学家和测 地学家的广泛关注。据不完全统计,自1805年至1864年的60年间,有关最 小二乘法的研究论文达256篇,一些百科全书包括1837年出版的大不列颠百 科全书第7版,亦收入有关方法的介绍。同时,误差的分布是“正态”的,也 立刻得到天文学家的关注及大量经验的支持。 如贝塞尔(F. W. Bessel, 17841846)对几百颗星球作了三组观测,并比较了按照正态规律在给定范围内 的理论误差值和实际值,对比表明它们非常接近一致。拉普拉斯在1810年也 给出了正态规律的一个新的理论推导并写入其

2、分析概论中。正态分布作 为一种统计模型,在19世纪极为流行,一些学者甚至把19世纪的数理统计学 称为正态分布的统治时代。在其影响下,最小二乘法也脱出测量数据意义之 外而发展成为一个包罗极大,应用及其广泛的统计模型。到20世纪正态小样 本理论充分发展后,高斯研究成果的影响更加显著。最小二乘法不仅是19世 纪最重要的统计方法,而且还可以称为数理统计学之灵魂。相关回归分析、 方差分析和线性模型理论等数理统计学的几大分支都以最小二乘法为理论 基础。正如美国统计学家斯蒂格勒(S. M. Stigler) 所说,“最小二乘法之 于数理统计学犹如微积分之于数学”。最小二乘法是参数回归的最基本得方 法所以研究

3、最小二乘法原理及其应用对于统计的学习有很重要的意义。2.最小二乘法所谓最小二乘法就是:选择参数b0, b1,使得全部观测的残差平方和最小用数学公式表示为:2 八2 2min u (Yi - Y)2 一 (Yj - b0 - b )2为了说明这个方法,先解释一下最小二乘原理,以一元线性回归方程为例.由于总体回归方程不能进行参数估计,我们只能对样本回归函数来估计即:Y 二 bo b)Xi ei (i 二 1,2.n)从上面的公式可以看出:残差ei是Yi的真实值与估计值之差,估计总体回归函数最优方法是,选择Bo,Bi的估计量bo,bi,使得残差ei尽可能的小. 总之,最小二乘原理就是选择样本回归函数

4、使得所有 丫的估计值与真实值差的平方和为最小,这种确定bo,bi的方法叫做最小二乘法。最小二乘法是回归分析中的最基本的方法。回归方程一般分为2类,线 性回归方程和非线性回归方程。2.1线性回归最小二乘法最小二乘法是由实验或调查的数据,建立线性型公式的一种常用方法 .在建立线性型公式中,虽然有很多种不同的方法来求样本回归函数 (即真实 总体回归函数的估计值),但是在回归分析中最广泛应用的方法是最小二乘 法.如果变量x和y有精确的线性关系比如说 y =ax b ,那么yi二yi即观测 值与回归值是相等的.事实上现实世界中的诸多变量的关系未必都是如此, 由于受诸多随机因数的干扰使得物与物之间没有那种

5、很明确的对应关系 .比如说人的身高和体重就是一个对应, 我们都知道长的高的人不一定就重, 同 理长的矮的人也不一定就轻.但身高和体重的确存在着一定的关系 ,而这种 关系并非是y =ax b所能确定的.那么我们要寻求身高和体重之间的关系就需要通过数学的方法.首先调查统计得出数据;其次把数据描绘出来;然后 拟合一条跟已有的图象最接近的曲线,这样就可以相对地将身高和体重之间 的关系表示出来.在处理类似的事情中常常用到最小二乘法.2.2非线性回归最小二乘法非线性回归的种类很多,常用的有抛物线方程(Y=abX cX2)、指数方程(Y =abx)等。设已知列表函数yi =f(xj(i =0,1,,m),并

6、且我们想用一个通常的n( : m)次多项式Pn X 二 ao yx . anXn ( 1)去近似它。问题是应该如何选择 a0,印,an使pn x能较好地近似列表函数f x。按最小二乘法,应该选择ao,ai,., an使得m 2(2)S a。,ai,., an 八 f X - pn xi =0取最小。注意到S是非负的,且是ao, ai,.,an的2次多项式,它必有最小值。求S对ao, ai,., an的偏导数,并令其等于零,得到m- - a。- a/i -. - anxj xj = 0 (k = 0,1,., n)i 进一步,可以将它们写成m mm m二 /Xi1二a0二 xik - ar xk

7、 1 . an二 xk n (k = 0,1,n.=o引进记号i =oi =0 i =0m mSk =送 Xik和Uk =送 yiXikin in则上述方程组为rs)a0 + sa 打lt+Snan = u , so + s a 卄lt+Sn+an1=u , 1 川 Illi川 Mil 川 lllllil 川 I 胛0 +SnW 旷川+Snan =Un它的系数行列式是S)3IIISnXn舟=S2IIISnd1*KHFSnS1 +IIIS2n由s(i =0,1川,2n)的定义及行列式性质,可以断言1 2Xn 十一-Z 川,n ). (n + 1 ) !此处符号W表Vandermonde亍列式,而

8、是对所有可能的i( = 0,1|, n)求和(每个i可以取值Xo , X|, | 1( , Xm ,并且当 j时i = j。由(4)式及Van dermo nde行列式的性质可知,当x0,xjl|,xm互异时,11IH1t0一1IHtnm-01JlUn 戶巴2 -0芒2一 1IH巴2n式0.+巴n -0巴n一1IHF巴n n从而,Xn十H0(a0 )方程组有唯解a, a1,川,an ,且它们使取极小值如此,我们应用最小二乘法找到了 f x的近似多项式pn x .在利用最小二乘法组成和式 时,所有点X都起到了同样的作用,但 是有时依据某种理由认为中的某些项的作用大些,而另外一些作用小些 (例如,

9、一些y是由精度较高的仪器或操作上比较熟练的人员获得的,自然应该予以较大的信任),这在数学上表现为用和m 2:i f x - Pn X ( 5)i 二0n替代和取最小值 q .0,且-;1,i通常称之为权;而为加权和.i用多项式Pn xa0 a1x anxn去近似一个给定的列表函数(即给出的一组观测值 = f Xi时。需要确定的参数是ao,ai,|)(,an;而Pn x可以看 成是ao, aiJ|, an的线性函数但是有时在利用观测或实验数据去确定一个经 验公式时,往往要确定的函数和待定参数之间不具有线性形式的关系 .这样问题就变得有些复杂然而,常常可以通过变量替换使其线性化最小二乘法原理是用来

10、求解线性方程组的,非线性方程经线性化后方可 应用该原理.通常在测量中遇到的问题不一定都是线性问题,必须先把非 线性问题线性化,然后求解例如:(i )有时,我们希望用如下类型的函数:s = ptq (6)去近似一个由一组观测数据(列表)所描绘的函数,其中 P和q是待定的两 个参数.显然s已非p和 q的线性函数.怎样线性化呢?为此,我们在 式两端 取对数,得到Ins 二 Inp qlnt记 Ins 二 y, I np 二 a。, ai 二 q,x = I nt,贝 U (6)式变成y = a。 aix .这是一个一次多项式,它的系数ao和ai可以用最小二乘法求得.(ii) 我们经常希望用函数S =

11、 AeCt (7)去近似一个以给定的列表函数,其中 A、C是待定的参数.这时,我们可以(7) 的两端取对数:InS 二 InA Ct记 InS 二 y, InA 二 a0Q =印,x = t,则(1.7)式变成y 二 ao aix这样仍可用最小二乘法定出a。 (从而也就定出了 A,C ),得到近似函数S = AeCt下面列出几种常用的线性处理方法,利用最小二乘法的原理对直线型、 抛物线型和指数曲线型的方程的参数估计方法,介绍如下:(1)直线型直线方程的一般形式为Y = a bX令(Y-C)2八(a FX-C)2为最小值,分别为a和b求偏导数,并令导数等于0,得到联立方程组。解方程组,即可得到参

12、数的计算公式 。a=Y _bX/ n送X Y 送X送丫b = 2 2. n瓦 X2-(瓦 X)2(2)抛物线型抛物线方程的一般形式为2Y = a bX cX 2令 ( -C) (a bX -C)2为最小值,分别为a、b、c求偏导数,Y - na - b. X - c_ X ? = 0 Y X2 _a X _b X2 _c x3 =0 Z YX2 _a送 X2 _bZ X3 _c瓦 x4 =0(3)指数曲线型 指数曲线的一般形式为Y = abX取对数,将指数曲线转化成对数直线形式lg Y = lg a X lg b用最小二乘法估计参数a,b,可有如下方程组 lg Y 二 n lg a lg b

13、X二(X IgY) =lga X lg b X2解此方程组,可得参数的对数值,查其反对数,即可得参数值。3.最小二乘法原理的应用3.1最小二乘法原理在线性回归中应用例1.已知2009年3月到2010年4月居民收入与物价信心的满意指数如下 图,求出当期物价满意指数x与时间t的曲线拟合。T123456X29.5028.2025.9021.7021.9013.80解:t=1 2 3 4 5 6;x=29.50 28.20 25.90 21.70 21.90 13.80;plot(t,x,o);polyfit(t,x,1) ans =-2.9029 33.6600则所得到的近似方程为y=-2.9029

14、+33.6600x.3.2最小二乘法原理在非线性回归中的应用例2设已知函数f (x)的表列值为X0.20.50.70.851Y1.2211.6492.0142.3402.718试按最小二乘法构造f (x)的二次近似多项式. 解:下面用Matlab程序来求参数a。和a2. 程序如下:x=0.2 0.5 0.7 0.85 1;y=1.221 1.649 2.014 2.340 2.718;plot(x,y,o);2.82.62.42.221.81.61.41.20.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1polyfit(x,y,2)ans =0.9248 0.7553 1.0

15、346即所求 30=0.9248 , a1 =0.7553 , 32=1.0346.所求的近似多项式为f(x) =0.9248 0.7553X 1.0346x2 .例3、在某冶炼过程中,根据统计数据的含碳量与时间关系,试求含碳量y与时间t的拟合曲线t0510152025303540455055y01.272.162.863.443.874.154.374.514.584.024.64解:实验程序如下:t=0 5 10 15 20 25 30 35 40 45 50 55;y=0 1.27 2.16 2.86 3.44 3.87 4.15 4.37 4.514.58 4.02 4.64;plot

16、(t,y,o);5厂4.5-4 -3.5-3 -2.5-2 -1.5-1 -0.5 -0 L0 10 20 30 40 50p=polyfit(t,y,2)P =-0.0024 0.2037 0.2305综上,y与t的拟合曲线是y=-0.0024+0.2037t+0.0.2305 t2。例2设已知如下一组实验数据:t =2.2 2.7 3.5 4.1S =65 60 53 50试求一个S二AeCt型的函数去近似它.60解:计算以紧凑的形式表示如下:X。x = Intx2y = Insxy10.34240.11721.81290.620710.43140.18611.77820.767110.5

17、4410.29601.72430.938210.61280.37551.69901.041141.93070.97487.01443.3671S0SS2UoU1由此得方程组4a0 1.9307a, =7.0144,1.9307a 0.9748a, =3.3671.解之得 a0 = Inp =1.963, p = 91.9, q = ai - -0.434 从而0.434S =91.9t4.小结应用最小二乘法的几个问题:最小二乘法虽然在数据处理方面具有显著的效果,但如果使用不当会导 致很大的误差,甚至错误的结果。因此,在应用时必须注意以下几个问题:(1)慎重选择拟合关系式。在实际问题中,适当选择

18、拟合关系式是一项 十分谨慎的工作,它将直接影响计算的工作量和结论。(2)自变量的选择。在实际工作中,对一组实验x1,y1数据按不同的拟 合形式,结果会不一样。特别注意当两个变量都有一定误差时,应当使用双变 量最小二乘法进行处理,否则可以使用单变量最小二乘法。(3)加权最小二乘法。此法是应用于实验测量值 Y1非等精度的情况下的拟合方法。它不同程度的消除误差因素,结果更准确可靠。设拟合函数为y = f(x),当x值取xi时y的实测值为取“-f(x,卜 mm 2加权偏差平方和s = v wi yf xi ,式中wi为第i个实验点的权i 4 i=J重因子。选取合适的权重因子 Wi可获得高精度的拟合参数

19、。(4) 最小二乘原理在很多领域有着广泛应用,利用MATLAB解非常方便, 但一定要组要问题的类型,尤其是数据大且复杂时,来更好的突出 Matlab计 算出线性参数的最佳估计值,提高了效率和精度。(5) 非线性参数的最小二乘法处理程序可归结为:首先根据具体问题将 非线性问题线性化,列出误差方程;再按最小二乘法原理,利用求极值的方 法将误差方程转化为正规方程;然后求解正规方程,得到待求的估计量;最后给出精度估计。上面例题利用程序求解组合测量问题,用 Matlab进行曲线的拟合。致谢:长江之滨,青山湖畔,是我美丽的校园。转眼间,我已经在美丽的湖师 度过了四个年头。四年,这是我人生中非常重要的四年,

20、我有幸能够接触到 这些不仅传授我知识、学问,而且从更高层次指导我的人生与价值追求的良 师。他们使我坚定了人生的方向,获得了追求的动力,留下了大学生活的美 好回忆。在此,我真诚地向我尊敬的老师们和母校表达我深深的谢意!这篇论文是在我的导师胡宏昌教授的多次指导下完成的。 从论文的选题到结构安排,从内容到文字润饰,都凝聚了他大量的心血。在这篇论文的写 作过程中,胡老师不辞辛劳,不惜在百忙的工作学习中抽出时间多次与我就 论文中许多核心问题作深入细致地探讨,给我提出切实可行的指导性建议, 无论是论文的整体机构,还是论文的文字、排版还是一个标点符号,胡老师 都是认真的帮我查看并细心全面地帮我修改。更重要的是胡老师在指导我的 论文的过程中,不顾自己由于长时间在电脑前工作的颈椎的疼痛还依然在我 每次过去找他帮我修改论文时,细心的在电脑前为我指出排版的错误,甚至 一个标点符号。胡老师这种一丝不苟的负责精神,使我深受感动。在此,请 允许我向尊敬的胡宏昌老师表示真挚的谢意!

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1