数据分析与R语言_003.pdf

上传人:b****1 文档编号:3211549 上传时间:2022-11-20 格式:PDF 页数:27 大小:1.09MB
下载 相关 举报
数据分析与R语言_003.pdf_第1页
第1页 / 共27页
数据分析与R语言_003.pdf_第2页
第2页 / 共27页
数据分析与R语言_003.pdf_第3页
第3页 / 共27页
数据分析与R语言_003.pdf_第4页
第4页 / 共27页
数据分析与R语言_003.pdf_第5页
第5页 / 共27页
点击查看更多>>
下载资源
资源描述

数据分析与R语言_003.pdf

《数据分析与R语言_003.pdf》由会员分享,可在线阅读,更多相关《数据分析与R语言_003.pdf(27页珍藏版)》请在冰豆网上搜索。

数据分析与R语言_003.pdf

DATAGURU专业数据分析网站2012.5.28数据分析与R语言第4周DATAGURU专业数据分析网站2012.5.28假设检验原理2DATAGURU专业数据分析网站2012.5.28假设检验的原理3DATAGURU专业数据分析网站2012.5.28假设检验的原理4DATAGURU专业数据分析网站2012.5.28否定域5DATAGURU专业数据分析网站2012.5.28不否定正确6DATAGURU专业数据分析网站2012.5.28T分布密度函数7DATAGURU专业数据分析网站2012.5.28T分布密度函数8DATAGURU专业数据分析网站2012.5.28T检验法9DATAGURU专业数据分析网站2012.5.28lm()线性模型函数y1+x或yx均表示y=a+bx有截距形式的线性模型通过原点的线性模型可以表达为:

yx-1或yx+0或y0+x参见help(formula)10DATAGURU专业数据分析网站2012.5.28与线性模型有关的函数建立数据:

身高-体重x=c(171,175,159,155,152,158,154,164,168,166,159,164)y=c(57,64,41,38,35,44,41,51,57,49,47,46)建立线性模型a=lm(yx)求模型系数coef(a)(Intercept)x-140.364361.15906提取模型公式formula(a)yx11DATAGURU专业数据分析网站2012.5.28与线性模型有关的函数计算残差平方和(什么是残差平方和)deviance(a)164.82657绘画模型诊断图(很强大,显示残差、拟合值和一些诊断情况)plot(a)计算残差residuals(a)1234567-0.83495441.5288044-2.9262307-1.2899895-0.81280861.23282962.8690708891011121.27846782.6422265-3.03965293.0737693-3.721532212DATAGURU专业数据分析网站2012.5.28与线性模型有关的函数打印模型信息print(a)Call:

lm(formula=yx)Coefficients:

(Intercept)x-140.3641.15913DATAGURU专业数据分析网站2012.5.28与线性模型有关的函数计算方差分析表14DATAGURU专业数据分析网站2012.5.28与线性模型有关的函数提取模型汇总资料15DATAGURU专业数据分析网站2012.5.28与线性模型有关的函数作出预测z=data.frame(x=185)predict(a,z)174.0618predict(a,z,interval=prediction,level=0.95)fitlwrupr174.061865.986282.13739课后阅读:

薛毅书,p308,计算实例16DATAGURU专业数据分析网站2012.5.28多元线性相关分析研究多个变量之间的关系例子:

iris数据集,研究花瓣和花萼的长度、宽度之间的联系准备数据:

x=iriswhich(iris$Species=setosa),1:

4画出散点图集:

plot(x)17DATAGURU专业数据分析网站2012.5.28多元线性相关分析计算相关系数矩阵,cor()函数暂时没有发现可以在多元情况下进行相关性检验的函数,只能对变量两两进行检验18DATAGURU专业数据分析网站2012.5.28多元线性回归Swiss数据集:

SwissFertilityandSocioeconomicIndicators(1888)Data19DATAGURU专业数据分析网站2012.5.28多元线性回归建立多元线性模型20DATAGURU专业数据分析网站2012.5.28多元线性回归模型汇总信息21DATAGURU专业数据分析网站2012.5.28多元线性回归多元线性回归的核心问题:

应该选择哪些变量?

一个非典型例子(薛毅书p325)RSS(残差平方和)与R2(相关系数平方)选择法:

遍历所有可能的组合,选出使RSS最小,R2最大的模型AIC(Akaikeinformationcriterion)准则与BIC(Bayesianinformationcriterion)准则AIC=nln(RSSp/n)+2pn为变量总个数,p为选出的变量个数,AIC越小越好22DATAGURU专业数据分析网站2012.5.28多元线性回归逐步回归向前引入法:

从一元回归开始,逐步增加变量,使指标值达到最优为止向后剔除法:

从全变量回归方程开始,逐步删去某个变量,使指标值达到最优为止逐步筛选法:

综合上述两种方法23DATAGURU专业数据分析网站2012.5.28多元线性回归step()函数24DATAGURU专业数据分析网站2012.5.28多元线性回归是否还有优化余地?

使用drop1作删除试探,使用add1函数作增加试探25DATAGURU专业数据分析网站2012.5.28多元线性回归薛毅书,p330例子26DATAGURU专业数据分析网站FAQ时间27

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > PPT模板 > 图表模板

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1