ImageVerifierCode 换一换
格式:DOCX , 页数:13 ,大小:365.04KB ,
资源ID:4957266      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/4957266.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(sas进行多元非线性回归+sas中方差分析解读.docx)为本站会员(b****5)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

sas进行多元非线性回归+sas中方差分析解读.docx

1、sas进行多元非线性回归+sas中方差分析解读SAS进行多元非线性回归多元非线性回归方程重要方法是转化为线性回归方程.转化时应首先选择适合的非线性回归形式,并将其线性化。对于实际问题,首先应对原始数据进行作图或通过观察,选择适当函数进行拟合。已知19782006年全国GDP(y),第一产业x1、第二产业x2、工业生产总值x3、第三产业生产总值x4,请建立y对x1x4的回归模型。plainviewplaincopyprint?1. dataex;2. inputyx1-x4;3. y1=log(y);z1=log(x1);z2=log(x2);z3=log(x3);z4=log(x4);/*对数

2、据做变化,取对数后再做回归分析*/4. cards;5. 16.84535.60927.44366.37353.79256. 21.3836.632910.05858.75844.69167. 23.17166.581911.14249.66235.44738. 25.72897.097412.318110.66416.31349. 28.62477.797313.510111.2887.317310. 32.31039.195214.634312.08648.480811. 36.403710.068816.166412.982210.168512. 45.077412.084419.730

3、115.583813.262913. 51.474913.139522.25217.452816.083414. 63.413517.454327.536321.419321.122915. 82.348419.430435.629428.867827.288616. 92.714321.203139.383233.019432.12817. 101.463324.377240.579634.337836.506518. 117.417824.194148.475941.011444.747819. 147.521326.615162.683452.289358.221920. 188.895

4、830.161382.385367.892176.349221. 253.057735.8777111.32491.4335105.85622. 320.407245.578137.4362102.6372137.39323. 397.570158.3757167.9238130.2389171.270624. 475.869168.732197.5005157.0486209.636625. 534.596970.7519222.8439174.1697241.001126. 580.03671.3285238.4684187.0766270.239127. 656.409874.11042

5、68.3988206.0297313.900628. 728.077478.3636297.0933217.9077352.620529. 812.846979.1826328.0378229.521405.626530. 929.485883.2886393.6734268.2806452.523831. 1133.8828103.3327504.571341.5303525.979132. 1519.90112.59655.27469.28752.0433. 1790.66123.25774.66584.41892.7534. ;35. procreg;/*reg调用回归模块*/36. m

6、odely1=z1z2z3z4/cli;/*表示以z1z2z3z4为自变量,y1为应变量建立回归模型,/cli表示要求预测区间。加入/selection=stepwise时,表示逐步回归37. proccorr;varz1-z4;/*求相关系数矩阵*/38. run; data ex; input y x1-x4; y1=log(y);z1=log(x1);z2=log(x2);z3=log(x3);z4=log(x4);/*对数据做变化,取对数后再做回归分析*/ cards; 16.8453 5.6092 7.4436 6.3735 3.7925 21.383 6.6329 10.0585

7、8.7584 4.6916 23.1716 6.5819 11.1424 9.6623 5.4473 25.7289 7.0974 12.3181 10.6641 6.3134 28.6247 7.7973 13.5101 11.288 7.3173 32.3103 9.1952 14.6343 12.0864 8.4808 36.4037 10.0688 16.1664 12.9822 10.1685 45.0774 12.0844 19.7301 15.5838 13.2629 51.4749 13.1395 22.252 17.4528 16.0834 63.4135 17.4543 2

8、7.5363 21.4193 21.1229 82.3484 19.4304 35.6294 28.8678 27.2886 92.7143 21.2031 39.3832 33.0194 32.128 101.4633 24.3772 40.5796 34.3378 36.5065 117.4178 24.1941 48.4759 41.0114 44.7478 147.5213 26.6151 62.6834 52.2893 58.2219 188.8958 30.1613 82.3853 67.8921 76.3492 253.0577 35.8777 111.324 91.4335 1

9、05.856 320.4072 45.578 137.4362 102.6372 137.393 397.5701 58.3757 167.9238 130.2389 171.2706 475.8691 68.732 197.5005 157.0486 209.6366 534.5969 70.7519 222.8439 174.1697 241.0011 580.036 71.3285 238.4684 187.0766 270.2391 656.4098 74.1104 268.3988 206.0297 313.9006 728.0774 78.3636 297.0933 217.907

10、7 352.6205 812.8469 79.1826 328.0378 229.521 405.6265 929.4858 83.2886 393.6734 268.2806 452.5238 1133.8828 103.3327 504.571 341.5303 525.9791 1519.90 112.59 655.27 469.28 752.04 1790.66 123.25 774.66 584.41 892.75 ; proc reg;/*reg调用回归模块*/ model y1=z1 z2 z3 z4/cli;/*表示以z1 z2 z3 z4为自变量,y1为应变量建立回归模型,/

11、cli表示要求预测区间。加入/selection=stepwise时,表示逐步回归 proc corr;var z1-z4;/*求相关系数矩阵*/ run; (1)回归方程显著性检验由AnalysisofVariance表可知,其FValue=73270.5,PrF的值小于0.0001,远小于0.05,故拒绝原假设,接受备择假设,认为y1与z1,z2,z3,z4之间具有显著的线性相关关系;由R-Square的值为0.9999可知该方程的拟合度很高,样本观察值有99.99%的信息可以用回归方程进行解释,故拟合效果较好。(2)参数显著性检验由ParameterEstimates表可知,对自变量z3

12、检验t值为t=-0.36,Pr|t|的值等于0.7256,大于0.05,因此接受原假设H0:3=0认为z3的系数应为0,说明z3的系数没有通过检验.为此,需要在程序modelyz1z2z3z4中去掉z3.再次运行得到结果由ParameterEstimates表可知,对常数检验t值为t=14.79,Pr|t|的值小于0.0001,远小于0.05,说明截距项通过检验.为此,估计值为0.96744.对自变量z1检验t值为-.为此,估计值为-.对自变量z2检验t值为-为此,估计值为-.对自变量z4检验t值为-为此,估计值为-.以上结果表明所有变量的系数均通过检验,于是该线性模型即可得到。(如果有多个系

13、数没通过检验,可使用逐步回归方法,在y1=z1z2z3z4后加/selection=stepwise表示逐步回归,让软件自动保留通过检验的变量)(3)拟合区间以上仅列出10个样本的拟合结果,其中DepVary1为因变量的原始值,PredictedValue为y的拟合值,95%CLPredict为拟合值95%的拟合区间,Residual为残差.例如,第一组原函数值为2.8241,拟合区间为2.7457,2.8176,残差为0.0424.综合以上分析,可以得到线性回归方程:y1=0.09768z1+0.65586z2+0.24696z4+0.96744又因为y1=ln(y),zi=(xi)(i=1

14、,2,4),将方程还原可以得到y关于x1,x2,x4的函数式:y=2.6312*x10.0977*x20.656*x40.247其中y表示全国GDP总值,x1表示第一产业生产总值,x2表示第二产业生产总值,x4表示第三产业生产总值。总结:首先用方差分析法检验因变量y与m个自变量之间的线性回归方程有无显著性;其次对每个自变量的偏回归系数进行t检验,以剔除在方程中不起作用的自变量4.3SAS方差分析入门1.用ANOVA过程进行单因素方差分析单因素方差分析是4.1.2问题的一个自然延续。在4.1.2中,我们有一个分类变量把观测分为两组,我们要研究这两组的均值有没有显著差异。如果这个分类变量的取值不只

15、两个,则这时4.1.2的检验方法不再适用,但我们同样要解决各组均值是否有显著差异的问题。如果各组之间有显著差异,说明这个因素(分类变量)对指标是有显著影响的,因素的不同取值(叫做水平)会影响到指标的取值。注意,经典的方差分析只判断因素的各水平有无显著差异,而不管两个水平之间是否有差异。方差分析把指标的方差分解为由因素的不同取值能够解释的部分,和剩余的不能解释的部分,然后比较两部分,当能用因素解释的部分明显大于剩余的部分时认为因素是显著的。方差分析假定观测是彼此独立的,观测为正态分布的样本,由因素各水平分成的各组的方差相等。在这些假定满足时,就可以用ANOVA过程来进行方差分析。其一般写法为:P

16、ROCANOVADATA=数据集;CLASS因素;MODEL指标=因素;RUN;例1:为了分析SASUSER.VENEER中各种牌子的胶合板的耐磨性有无显著差别,首先我们假定假设检验使用的检验水平为0.05,可以使用如下程序进行方差分析:procanovadata=sasuser.veneer;classbrand;modelwear=brand;run;结果可以分为四个部分,第一部分是因素水平的信息,第二部分就是经典的方差分析表,表前面指明了因变量(指标)为WEAR,第一列来源(Source)说明方差的来源,是模型(Model)的(可以用方差分析模型解释的),误差(Error)的(不能用模型

17、解释的),还是总和(CorrectedTotal)。第三列为平方和,其大小代表了各方差来源作用的大小。第二列为自由度。第四列为均方,即平方和除以自由度。第五列F值是F统计量的值,其计算公式为模型均方除以误差均方,用来检验模型的显著性,如果不显著说明模型对指标的变化没有解释能力。第六列是F统计量的p值。由于这里p值小于0.05(我们的检验水平),所以模型是显著的,因素对指标有显著影响。结果的第三部分是一些与模型有关的简单统计量,第一个是复相关系数平方,与回归模型一样仍代表总变差中能被模型解释的比例,第二个是变异系数,第三个是根均方误差,第四个是指标的均值。结果的第四部分是方差分析表的细化,给出了

18、各因素的平方和和F统计量,因为是单因素所以这一行与上面的模型一行相同。2用NPARIWAY进行非参数单因素方差分析当方差分析的正态分布假定或方差相等假定不能满足时,对单因素问题,可以使用称为Kruskal-Wallis检验的非参数方差分析方法。这种检验不要求观测来自正态分布总体,不要求各组的方差相等,甚至指标可以是有序变量(变量取值只有大小之分而没有差距的概念,比如磨损量可以分为大、中、小三档,得病的程度可以分为重、轻、无,等等)。NPARIWAY过程的调用与ANOVA过程不同,因为它是单因素方差分析过程,所以只要用CLASS语句给出分类变量(因素),用VAR语句给出指标就可以了,一般格式为:

19、PROCNPARIWAYDATA=数据集WILCOXON;CLASS因素:VAR指标:RUN;3.多重比较方差分析只检验各组是否没有任何两两之间的差异,但不检验到底是哪两组之间有显著差异。在三个或多个组之间进行两个或多个比较的检验叫做多重比较。多重比较在统计学中没有一个公认的解决方法,而是提供了若干种检验方法。因为多重比较要进行不只一次的比较,所以在多重比较的检验水平有两种:总错误率(experimentwiseerrorrate)和单次比较错误率(compa,risonwiseerrorrate)。总错误率是指所有比较(比如,五个组两两之间比较有10次)的总第一类错误概率,单次比较错误率是指

20、每一次比较的第一类错误概率。显然,总错误率要比单次比较错误率高。在ANOVA过程中使用MEANS语句可以进行多重比较。格式如下:MEANS因素选项;如果不使用选项,则ANOVA过程内的MEANS语句只对因素的各水平计算指标的平均值和标准差,比如:procanovadata=sasuser.veneer;classbrand;modelwear=brand;meansbrand;run;为了进行两两比较,可以在MEANS语句的选项中旨定检验方法。SAS提供了多种方法。一、用重复t检验控制单次比较错误率重复t检验的想法很简单:在适当的检验水平下用两样本t检验对所有组两两之间进行检验。控制的是每次比

21、较的第一类错误概率。缺省使用0.05水平。注意这样检验的总错误率将大大高于每次比较的错误率。比如,在上面程序后加入(ANOVA是交互式过程)。meansbrand/t;run;结果如下:下面给出了检验的一些指标,比如水平(Alpha)为0.05(控制单次比较的第一类错误概率),自由度(df)为15,误差的均方(MSE,是方差分析表中误差的均方1为0.020833,两样本t检验的t统计量的临界值(CriticalValueoft)为2.13,如果两样本t检验的t统计量值绝对值超过临界值则认为两组有显著差异,或者等价地,如果两组的均值之差绝对值大于最小显著差别(LeastSignificantDi

22、fference)0.2175也是有显著差异。所以这个检验也叫LSD检验。下面列出了检验的结果,把因素各水平的指标平均值由大到小排列,然后把两两比较的结果用第一列的字母来表示,字母相同的水平没有显著差异,字母不同的水平有显著差异。所以我们看到,重复t检验的结果把五种牌子分成了A、B、C三个组,TUFFY单独是一组,它的磨损量最大;XTRA、CHAMP、ACME是一组,这三种两两之间没有显著差异;AJAX单独是一组,其磨损量最小。二、用Bonferronit检验控制总错误率Bonferronit检验通过把每次比较的错误率取得很小来控制总误差率。比如,共有10次比较时,把每次比较的错误率控制在0.

23、005就可以保证总错误率不超过0.05,但是,这样得到的实际总第一类错误率可能要比预定的水平小得多。在MEANS语句中使用BON语句可以执行Bonferronit检验,缺省总错误率控制水平为0.05。对上面数据增加如下语句:meansbrand/bon;run;结果先说明了检验类型和指标,然后说明了检验控制总第一类错误率,但一般比REGWQ方法的第二类错误概率高(检验功效较低)。下面给出了几个检验用的值。最后给出了Bonferronit枪验的结果,有相同分组字母的因素水平间无显著差异,否则有显著差异。我们看到,TUFFY与XTRA、CHAMP、ACME没有显著差异,与AJAX有显著差异;XTR

24、A、CHAMP、ACME两两之间没有显著差异,而且与其它两个也都没有显著差异;AJAX与TUFFY有显著差异,与其它三个没有显著差异。其分组是有交叉的。最后只发现了TUFFY和AJAX之间有显著差异。三、用REGWQ检验控制总错误率用Bonferronit检验控制总错误率过于保守,功效较低,不易发现实际存在的显著差异。REGWQ方法可以控制总错误率并且一般比Bonferronit检验要好。这种方法执行多阶段的检验,它对因素水平的各种子集进行检验。在MEANS语句中用REGWQ选项可以进行REGWQ检验。例如,在前面的例子后再运行:meansbrand/regwq;run;MEANS语句的选项可

25、以同时使用。在MEANS语句中可以用ALPHA=水平值来指定检验的水平。ANOVA过程中还提供了其它的多重比较方法,请自己参考有关资料。4.多因素方差分析SAS提供了若干个方差分析过程,可以考虑多个因素、有交互作用、有嵌套等情况的方差分析。用GLM过程还可以用一般线性模型来处理方差分析问题。在这里我们只介绍如何用ANOVA过程进行均衡设计的多因素方差分析。例如:为了提高一种橡胶的定强,考虑三种不同的促进剂(因素A)、四种不同分量的氧化锌(因素B)对定强的影响,对配方的每种组合重复试验两次,总共试验了24次,得到表的结果。B:氧化锌A:促进剂1234131,3334,3635,3639,3823

26、3,3436,3737,3938,41335,3737,3839,4042,44首先把数据输入为SAS数据集。输入的办法可以是直接输入各个观测,例如:datarubber;inputabstren;cards;1131113312341236;run;为了研究两个因素的主效应和交互作用,使用如下ANOVA过程:procanovadata=rubber;classab;modelstren=aba*b;run;ANOVA也可以用来分析正交设计的结果。5用Analyst作方差分析Analyst的Statistics-ANOVA菜单提供了七种方差分析方法,我们这里只介绍前三种:单因素方差分析(One

27、-WayANOVA)、非参数单因素方差分析(NonparametricOne-WayANOVA)、多因素方差分析(FactorialANOVA)。为了对SASUSER.VENEER进行方差分析,选Statistics-ANOVA-One-WayANOVA),弹出对话框,我们要指定因变量(Dependent,即指标)和自变量(Independent,即因素)。用这里的Tests钮可以选择一些其他的检验,比如对各组方差相等假设的检验,稳健的Welch方差如权方差分析等。Means按钮用来进行多重比较,可以选择多种比较方法。这个菜单调用的是PROCANOVA,所以最后的结果与上面编程得到的结果一致。用Statistics-ANOVA-NonparametricOne-WayANOVA可以作Kruskal-Wallis检验。它调用PROCNPARIWAY。用Statistics-ANOVA-Fa,ctorialANOVA可以进行多元方差分析。它调用PROCGLM,这个过程与ANOVA的差别在于它允许非均衡设计。对于均衡设计如上面的橡胶试验这里得到的结果与PROCANOVA得到的结果是一致的。

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1