R语言吸烟者假设检验数据分析可视化案例分析报告附代码数据.docx
《R语言吸烟者假设检验数据分析可视化案例分析报告附代码数据.docx》由会员分享,可在线阅读,更多相关《R语言吸烟者假设检验数据分析可视化案例分析报告附代码数据.docx(2页珍藏版)》请在冰豆网上搜索。
R语言吸烟者假设检验数据分析可视化案例分析报告附代码数据
R语言吸烟者假设检验数据分析案例分析报告
加载
#download.file("http:
//www.openintro.org/stat/data/nc.RData",destfile="nc.RData")
load("nc.RData")
这个数据集有什么情况?
我们的样本中有多少个案例
summary(nc)
Categorical:
Maturity,premie,marital,lowbirthweight,gender,habit.whitemom
Numerical:
fage,mage,weeks,gained,visits,weight.
对于数值变量,是否有异常值?
par(mfrow=c(3,2))
hist(nc$fage)
hist(nc$mage)
hist(nc$weeks)
hist(nc$gained)
hist(nc$visits)
hist(nc$weight)
你可以看到,重量和周数低的离群值和访问具有很高的异常值。
做一个并排boxplot。
强调这两个变量之间的关系是什么?
boxplot(nc$weight~nc$habit,data=nc,col="lightblue")
吸烟者似乎有重量较轻的婴儿。
检查是否满足推理所需的条件。
请注意,您将需要获取样本大小以检查条件。
您可以使用上面的命令来计算组大小,但是用长度替换平均值。
len<-by(nc$weight,nc$habit,length)
len
##nc$habit:
nonsmoker
##[1]873
##--------------------------------------------------------
##nc$habit:
smoker
##[1]126
len>30
##nc$habit
##nonsmokersmoker
##TRUETRUE