ImageVerifierCode 换一换
格式:DOCX , 页数:23 ,大小:313.02KB ,
资源ID:10290155      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/10290155.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(回归分析论文.docx)为本站会员(b****8)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

回归分析论文.docx

1、回归分析论文回归分析论文合肥学院20152016第二学期多元统计分析课程论文论文题目 回归分析 姓 名 陈毅 学 号 1307021036 专 业 数学与应用数学(1)成 绩 2015.5一元线性回归分析及其应用摘要 应用一元线性回归分析南极站CAPETOWN68816从1901年到1960年这60年一月份的温度,根据最小二乘法的原理,采用SAS统计软件进行数据的处理,拟合出年份与温度间的线性关系。分析软件运算的结果,最终得到实际的一元线性关系。关键词 温度与年份 一元线性回归 t检验 一、线性回归理论(1)一元线性回归模型其中,为模型参数,为随机误差项,X是自变量,Y是因变量。对(X,Y)进

2、行观察,得到n组样本观测值,则有,其中为x对y的线性影响而形成的系统部分,反映两变量的平均变动关系,即本质特征,为随机干扰:各种偶然因素、观察误差和其他被忽视因素的影响。(2)最小二乘估计参数的最小二乘估计量使误差平方和达到最小,即其中正规方程: ,若可逆,经验回归方程: 回归拟合值和残差:回归拟合值 :拟合向量:残差值:残差向量:(3)最小二乘估计的性质(4)回归方程的显著性检验复相关系数:决定系数:即修正的线性模型回归的检验:方差来源平方和自由度F值回归误差总计RSSESSTSSpn-p-1n-1 回归系数检验:二、问题提出与分析下表为南极南部海洋站CAPETOWN68816从1901年到

3、1960年这60年一月份的温度,建立建立SAS数据文件,探讨年份与温度的关系。年份温度年份温度190119.6 193123.6 190219.3 193220.5 190319.9 193321.3 190420.7 193422.2 190520.8 193522.1 190619.9 193619.4 190720.7 193721.7 190819.8 193821.1 190921.3 193921.8 191021.4 194022.2 191121.1 194122.2 191220.9 194221.4 191322.8 194320.3 191420.4 194421.8 1

4、91522.9 194521.2 191621.4 194620.7 191721.6 194721.1 191821.6 194821.8 191920.5 194921.7 192022.7 195021.6 192120.0 195120.5 192220.3 195221.7 192321.0 195322.7 192422.1 195421.4 192520.9 195522.2 192621.8 195622.0 192722.3 195722.3 192821.7 195821.7 192922.5 195920.7 193021.2 196021.9 数据来源:三、模型建立 设

5、温度为因变量Y,年份为自变量X,建立一元线性回归模型如下:其中,为模型参数,为随机误差项。做出这组数据的散点图如下:从图中可以看出,因变量与自变量在带状区域内呈线性关系,且因变量随着自变量的增大而增大,所以可以预测这组数据可以用某条直线来拟合,且在回归模型中,。(1)程序(1):data ch;input wendu nianfen ;cards; 19.6 190119.3 190219.9 190320.7 190420.8 190519.9 190620.7 190719.8 190821.3 190921.4 191021.1 191120.9 191222.8 191320.4 19

6、1422.9 191521.4 191621.6 191721.6 191820.5 191922.7 192020.0 192120.3 192221.0 192322.1 192420.9 192521.8 192622.3 192721.7 192822.5 192921.2 193023.6 193120.5 193221.3 193322.2 193422.1 193519.4 193621.7 193721.1 193821.8 193922.2 194022.2 194121.4 194220.3 194321.8 194421.2 194520.7 194621.1 19472

7、1.8 194821.7 194921.6 195020.5 195121.7 195222.7 195321.4 195422.2 195522.0 195622.3 195721.7 195820.7 195921.9 1960;proc reg;model wendu=nianfen;print cli;plot wendu*nianfen p.*nianfen l95.*nianfen u95.*nianfen/overlay;symbol1 c=black v=triangle;symbol2 c=blue v=circle;symbol3 c=green v=square;symb

8、ol4 c=red v=star;run;程序(2):data ch;input wendu nianfen ;cards; 19.6 190119.3 190219.9 190320.7 190420.8 190519.9 190620.7 190719.8 190821.3 190921.4 191021.1 191120.9 191222.8 191320.4 191422.9 191521.4 191621.6 191721.6 191820.5 191922.7 192020.0 192120.3 192221.0 192322.1 192420.9 192521.8 192622.

9、3 192721.7 192822.5 192921.2 1930;proc reg;model wendu=nianfen;print cli;plot wendu*nianfen p.*nianfen l95.*nianfen u95.*nianfen/overlay;symbol1 c=black v=triangle;symbol2 c=blue v=circle;symbol3 c=green v=square;symbol4 c=red v=star;run;程序(3):data ch;input wendu nianfen ;cards; 23.6 193120.5 193221

10、.3 193322.2 193422.1 193519.4 193621.7 193721.1 193821.8 193922.2 194022.2 194121.4 194220.3 194321.8 194421.2 194520.7 194621.1 194721.8 194821.7 194921.6 195020.5 195121.7 195222.7 195321.4 195422.2 195522.0 195622.3 195721.7 195820.7 195921.9 1960;proc reg;model wendu=nianfen;print cli;plot wendu

11、*nianfen p.*nianfen l95.*nianfen u95.*nianfen/overlay;symbol1 c=black v=triangle;symbol2 c=blue v=circle;symbol3 c=green v=square;symbol4 c=red v=star;run;(2)程序说明首先利用DATA补建立数据集ch,INPUT语句中的wendu表示温度,nianfen表示年份。REG过程中的MODEL语句,nianfen作为回归变量或自变量,而把wendu作为相应变量或因变量。Print cli可以得到预测值、95%预测上限与下限、残差。Plot选项可以

12、制出数据点、回归直线和预测界限的图形。四、模型的检验与分析(1)程序(1)输出结果:程序(2)输出结果一:(2)输出结果二:REG 过程模型: MODEL1因变量: wendu 输出统计量观测因变量预测值预测均值标准误差95% 置信限预测残差119.600020.21400.297118.400522.0275-0.6140219.300020.27530.282118.471922.0787-0.9753319.900020.33660.267518.542622.1307-0.4366420.700020.39800.253218.612722.18330.3020520.800020.4

13、5930.239418.682022.23660.3407619.900020.52070.226118.750722.2906-0.6207720.700020.58200.213418.818622.34540.1180819.800020.64330.201518.885822.4008-0.8433921.300020.70470.190418.952422.45700.59531021.400020.76600.180419.018122.51380.63401121.100020.82730.171619.083222.57150.27271220.900020.88870.164

14、219.147522.62980.01131322.800020.95000.158519.211122.68891.85001420.400021.01130.154519.273922.7487-0.61131522.900021.07270.152519.336022.80931.82731621.400021.13400.152519.397322.87070.26601721.600021.19530.154519.457922.93270.40471821.600021.25670.158519.517822.99560.34331920.500021.31800.164219.5

15、76923.0591-0.81802022.700021.37930.171619.635223.12351.32072120.000021.44070.180419.692823.1885-1.44072220.300021.50200.190419.749723.2543-1.20202321.000021.56330.201519.805923.3208-0.56332422.100021.62470.213419.861323.38810.47532520.900021.68600.226119.916023.4560-0.78602621.800021.74730.239419.97

16、0023.52470.05272722.300021.80870.253220.023423.59400.49132821.700021.87000.267520.076023.6641-0.17002922.500021.93140.282120.127923.73480.56863021.200021.99270.297120.179223.8062-0.7927残差和0残差平方和19.47466预测残差 SS (PRESS)21.83816(3)输出结果三:程序(3)输出结果:(4)运行结果分析以程序(2)为例:输出结果1给出了由REG过程得到的方差分析与参数估计。方差分析给出了直线拟合

17、的这组数据的效果的信息。其中Source项表示用于识别这组数据中方差的来源,DF项表示用于识别这组数据中相应的自由度,总方差用Corrected Total标记,DF为样本容量减1(DF=30-1=29)。这个模型解释的偏差标记为Model,相应的自由度为1.Error的自由度是两个自由度的差(28=29-1).Sum of Squares表示平方和,这组数据的总偏差平方和可分解为模型平方和和误差平方和两个部分,及有一般形式:Total SS=Model SS + Error SS。容易看出总偏差平方和、模型平方和和误差平方和分别为27.92967、19.47466、8.45500。Mean

18、Square表示均方(MS),均方等于平方和除以自由度。Error MS=19.47466/28=0.69552,它是模型中误差方差的估计。F Value和PrF项给出了检验统计量的F值及相应的P值。F值等于MMS(模型均方)除以EMS(误差均方),它用于检验这样的假设:该回归模型是显著的。对于这组数据拟合后F值等于12.16,相应的P值小于0.0016,说明拟合的模型解释了这组数据总偏差的主要部分。R-Square(R平方)和Adj R-Sq(调整后的R平方):它们评价模型优劣的量,R平方等于Model SS除以Total SS。因为Total SS=Model SS+ Error SS,所

19、以R平方是Total SS中由Model SS构成的比值。换句话说,R平方是总偏差中有模型中那些变量引起的百分率。R平方的取值范围为0到1;它越接近1,表示该模型越能解释这组数据的偏差。改组数据拟合后的R平方等于0.3027,调整后的R平方等于0.2778,说明拟合的模型不太好,原因可能是某些数据有误,导致结果的不完美。在参数估计(Parameter Estimates)输出的部分主要给出了回归模型的系数以及系数是否显著地不为零。下面给出具体解释。Variable(变量)和Parameter为0,标记Variable的列给出了直线拟合的方程式中这些系数相应的变量。标记为Parameter Es

20、timate(参数估计)的列给出了这些系数的参数估计值。截距在Variable列用INTERCEPT标识。斜率在Variable列中用变量名标识。故简单的回归模型为:wendu=-96.38351+0.06133nianfenStandard是这些参数估计的标准误差,它可用来构造参数估计的置信区间。t Value给出了检验参数为0的原假设的t值。该值等于参数估计除以相应的标准误差。例如:-96.38351/33.69711=-2.86。Pr|t|给出了t值相应的P值,由于原假设的P值为0.00790.05,故认为模型中的截距显著不为0,不可以在模型中去掉。因此随着nianfen的增加wendu

21、也适当增加。参数域的区间估计公式为:参数估计值分为点标准误差。例如,参数的置信水平位95%的区间估计为(0.061-2.180.018,0.061+2.180.018)=(0.02176,0.10024)输出结果2给出了年份的预测值及95%的置信限等信息。Obs表示序号观测值,Dependent Varible(因变量)给出了温度的原始数据,Predicted Value(预测值)给出了温度的预测值,Std Error Mean Predict(预测的标准误差)给出了预测的标准误差。95% CL Predict(95%的置信限)给出了预测值的95%的置信限,共有2列,左边是预测值的95%置信下限,右边是预测值的95%置信上限,最后一列Residual给出了残差,它是实际值与预测值之间的差。输出结果3中,一个观测数据点用一个“”表示,拟合直线用一系列的“”构成,预测下界用“”,上界用“*”表示。五、总结 根据以上讨论得到:前30年温度与年份之间的关系的回归方程为:wendu=-96.38351+0.06133nianfen后30年温度与年份之间的关系的回归方程为:wendu=12.904+0.0044nianfen

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1