ImageVerifierCode 换一换
格式:DOCX , 页数:16 ,大小:276.85KB ,
资源ID:7631171      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/7631171.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(回归分析实验课实验8.docx)为本站会员(b****5)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

回归分析实验课实验8.docx

1、回归分析实验课实验8实验报告八 实验课程: 回归分析实验课 专业: 统计学 年级: : 学号: 指导教师: 完成时间: 得分: 教师评语:学生收获与思考:实验八含定性变量的回归模型4学时一、实验目的 1掌握含定性变量的回归模型的建模步骤3运用SAS计算含定性变量的各种回归模型的各参数估计及相关检验统计量二、实验理论与方法在实际问题的研究中,经常会遇到一些非数量型的变量。如品质变量;性别;战争与和平。我们把这些品质变量也称为定性变量,在建立回归模型的时候我们需要考虑到这些定性变量。定性变量的回归模型分为自变量含定性变量的回归模型和因变量是定性变量的回归模型。自变量含有定性变量的时候,我们一般引进

2、虚拟变量,将这些定性变量数量化。例如研究粮食产量问题,y为粮食产量,x为施肥量,另外考虑气候问题,分为正常年份和干旱年份两种情况,这个问题数量化方法就是引入一个0-1型变量D,令Di=1 表示正常年份,Di=0表示干旱年份,粮食产量的回归模型为:yi=0+1xi+2Di+i。因变量是定性变量时,一般用logistic回归模型分组数据的logistic回归模型,未分组数据的logistic回归模型,多类别的logistic回归模型,probit回归模型等。三. 实验内容1用DATA步建立一个永久SAS数据集,数据集名为xt103,数据见表21;对数据集xt103,建立y对公司规模和公司类型的回归

3、,并对所得到的模型进行解释。2研制一种新型玻璃,对其做耐冲实验。用一个小球从不同的高度h对玻璃做自由落体撞击,玻璃破碎记为y=1,玻璃未破碎记y=0.数据见表22.是对表中数据建立玻璃耐冲性对高度h的logistic回归,并解释回归方程的含义。3某学校对本科毕业生的去向做了一个调查,分析影响毕业去向的相关因素,结果见表23.其中毕业去向“1=工作,“2=读研,“3=出国留学。性别“1=男生,“0=女生。用多类别的Logisitic回归分析影响毕业去向的因素。四实验仪器计算机和SAS软件五. 实验步骤和结果分析1用DATA步建立一个永久SAS数据集,数据集名为xt103,数据见表21;对数据集x

4、t103,建立y对公司规模和公司类型的回归,并对所得到的模型进行解释。R检验中R方为0.8951,可以认为回归拟合效果较好。回归方程通过F检验,说明模型是显著成立的。由参数估计表,可以看出,全部变量都是显著的,回归方程为:其中,x2是虚拟变量,当公司类型为“互助时,x2为0,为“股份时,x2为1。由方程可知,x2为1,即股份制公司的保险革新措施速度y会更大。股份制公司采取保险革新措施的积极性比互助型公司高,股份制公司建立在共同承当风险上,更愿意革新。公司规模越大,采取保险革新措施的倾向越大:大规模公司保险制度的更新对公司的影响程度比小规模公司大。SAS程序:data xt103;input y

5、 x1 x2 ;/*引入虚拟变量,将公司类型的互助设为0,股份设为1*/cards;17 151 026 92 021 175 030 31 022 104 00 277 012 210 019 120 04 290 016 238 028 164 115 272 111 295 138 68 131 85 121 224 120 166 113 305 130 124 114 246 1;run;proc reg data=xt103;model y=x1 x2;run;2研制一种新型玻璃,对其做耐冲实验。用一个小球从不同的高度h对玻璃做自由落体撞击,玻璃破碎记为y=1,玻璃未破碎记y=0.

6、数据见表22.是对表中数据建立玻璃耐冲性对高度h的logistic回归,并解释回归方程的含义。模型信息:模型解出的是y=0的概率。由三个检验中,统计量的P值都小于0.05,可以认为模型是显著的。由Wald检验的显著性概率及其P值,可以看出,h变量对方程的影响是显著的。由极大似然估计,各个参数系数也通过检验。因此模型有效。二元logit模型为模型意义为,小球掉落高度为h,那么玻璃未破碎的概率为p,而y=0表示玻璃未破碎。也就是说,该种新型的玻璃,用小球对其撞击,当小球的掉落高度为h时,玻璃未破碎的概率就是,那么,玻璃会破碎的概率就为1-p(y=0),这也可以看成是一种比例,就是大量实验中,同个高

7、度h,玻璃会被击破的比例。SAS程序:data wjz;input h y ;/*引入虚拟变量,将公司类型的互助设为0,股份设为1*/cards;1.50 01.52 01.54 01.56 01.58 11.60 01.62 01.64 01.66 01.68 11.70 01.72 01.74 01.76 11.78 01.80 11.82 01.84 01.86 11.88 11.90 01.92 11.94 01.96 11.98 12.00 1;run;proc logistic data=wjz;model y=h;run;proc logistic data=wjz;class

8、h;model y=h/link=glogit aggregate scale=none;run;3某学校对本科毕业生的去向做了一个调查,分析影响毕业去向的相关因素,结果见表23.其中毕业去向“1=工作,“2=读研,“3=出国留学。性别“1=男生,“0=女生。用多类别的Logisitic回归分析影响毕业去向的因素。专业课x1英语x2性别x3月生活费x4毕业去向y两个统计量的P值均大于0.05,说明模型拟合的较好。检验全局零假设: BETA=0 无效假设检验结果(似然比,评分的结果P值均小于0.01,具有显著统计学意义。三个变量中,有两个是不显著的变量,x3,x2,剔除x3:两个统计量的P值均大

9、于0.05,说明模型拟合的较好。检验全局零假设: BETA=0 无效假设检验结果(似然比,评分,wald的结果P值均小于0.01,具有显著统计学意义。三个变量都是显著的。以x4=“1,即参加工作,为参照。由模型可以看出:从参数估计表中,与参加工作的同学相比,读研的y=2的同学相比,读研的同学其专业课成绩更好x1的P值=0.003,而外语成绩x2的p值=0.356和经济状况x4的P值=0.184没有显著差异;出国留学的y=3学生其专业课成绩和参加工作的没有显著差异,外语成绩和经济状况那么更好。Sas程序:data a;input x1 x2 x3 x4 y;cards;95 65.0 1 600

10、 263 62.0 0 850 182 53.0 0 700 260 88.0 0 850 372 65.0 1 750 185 85.0 0 1000 395 95.0 0 1200 292 92.0 1 950 263 63.0 0 850 178 75.0 1 900 190 78.0 0 500 182 83.0 1 750 280 65.0 1 850 383 75.0 0 600 260 90.0 0 650 375 90.0 1 800 263 83.0 1 700 185 75.0 0 750 273 86.0 0 950 286 66.0 1 1500 393 63.0 0

11、1300 273 72.0 0 850 186 60.0 1 950 276 63.0 0 1100 196 86.0 0 750 271 75.0 1 1000 163 72.0 1 850 260 88.0 0 650 167 95.0 1 500 186 93.0 0 550 163 76.0 0 650 186 86.0 0 750 276 85.0 1 650 182 92.0 1 950 373 60.0 0 800 182 85.0 1 750 275 75.0 0 750 172 63.0 1 650 181 88.0 0 850 392 96.0 1 950 2;run;pr

12、oc print;run;proc logistic;class x3;model y(ref=3)=x1 x2 x3 x4/link=glogit aggregate scale=none ;run;proc logistic;class x3;model y(ref=3)=x1 x2 x4/link=glogit aggregate scale=none ;run;proc logistic;class x3;model y(ref=1)=x1 x2 x4/link=glogit aggregate scale=none ;run;六收获与思考七. 思考题 当自变量是定性变量的时候,我们需

13、要引进虚拟变量进行数量化,当定性变量有n个水平的时候,我们该引进多少的虚拟变量,否那么会怎样?不妨试试在sas中试试会出现什么问题。答:当定性变量有n个水平时应该引进n-1个虚拟变量。否那么最后一个虚拟变量无法用最小二乘估计计算出来。例:X1-X3为虚拟变量。Data a;input x1 x2 x3 x y;cards;1 0 0 1.26 75 1 0 0 1.35 77 1 0 0 1.40 78 1 0 0 1.58 820 1 0 1.71 65 0 1 0 1.76 66 0 1 0 1.80 68 0 1 0 1.85 700 0 1 1.22 68 0 0 1 1.35 69

14、0 0 1 1.46 70 0 0 1 1.44 72;proc reg data=a;model y=x1-x3 x;run;X3没有参数估计结果。因为x1 x2 x3出现完全共线性,x1 x2均为0时即代表了x3为1.表21iyx1公司类型117151互助22692互助321175互助43031互助522104互助60277互助712210互助819120互助94290互助1016238互助1128164股份1215272股份1311295股份143868股份153185股份1621224股份1720166股份1813305股份1930124股份2014246股份表22序号hmy序号hmy

15、11.500141.76121.520151.78031.540161.80141.560171.82051.581181.84061.600191.86171.620201.88181.640211.90091.660221.921101.681231.940111.700241.961121.720251.981131.740262.001表23序号专业课x1英语x2性别x3月生活费x4毕业去向y19565.01600226362.00850138253.00700246088.00850357265.01750168585.001000379595.001200289292.019502

16、96363.008501107875.019001119078.005001128283.017502138065.018503148375.006002156090.006503167590.018002176383.017001188575.007502197386.009502208666.0115003219363.0013002227372.008501238660.019502247663.0011001259686.007502267175.0110001276372.018502286088.006501296795.015001308693.005501316376.006501328686.007502337685.016501348292.019503357360.008001368285.017502377575.007501387263.016501398188.008503409296.019502

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1