1、R语言实验分析报告习题详解R语言实验报告习题详解 作者: 日期: R语言实验报告习题详解学院: 班级: 学号: 姓名: 导师: 成绩: 一、实验目的R是用于统计分析、绘图的语言和操作环境。R是属于GNU系统的一个自由、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具;本次试验要求掌握了解R语言的各项功能和函数,能够通过完成试验内容对R语言有一定的了解,会运用软件对数据进行分析;通过本实验加深对课本知识的理解以及熟练地运用R语言软件来解决一些复杂的问题。二、实验内容1.1问题叙述将1,2,20构成两个45阶的矩阵,其中矩阵A是按列输入,矩阵B是按行输入,并做如下运算.C=A+B;
2、D=A*B;F是由A的前3行和前3列构成的矩阵;G是由矩阵B的各列构成的矩阵,但不含B的第3列.1.2问题求解1.2.1创建按列、行输入的45矩阵;A-matrix(1:20,c(4,5)AB-matrix(1:20,nrow=4,byrow=TRUE)B1.2.2编写程序求解A-matrix(1:20,c(4,5)AB-matrix(1:20,nrow=4,byrow=TRUE)BC=A+BCD=A*BDF-A1:3,1:3FH-matrix(c(1,2,4,5),nrow=1)HG-B,HG1.3结果展示2.1问题叙述已知有5名学生的数据,如下表所示.用数据框的形式读入数据.学生数据序号姓
3、名性别年龄身高(cm)体重(kg)1张三女1415642.02李四男1516549.03王五女1615741.54赵六男1416252.05丁一女1515945.52.2问题求解2.2.1创建StudentData数据框StudentData-data.frame(name=c(zhangsan,lisi,wangwu,zhaoliu,dingyi),sex=c(F,M,F,M,F),age=c(14,15,16,14,15),height=c(156,165,157,162,159),weight=c(42,49,41.5,52,45.5)2.2.2运行程序求解StudentData-dat
4、a.frame(name=c(zhangsan,lisi,wangwu,zhaoliu,dingyi),sex=c(F,M,F,M,F),age=c(14,15,16,14,15),height=c(156,165,157,162,159),weight=c(42,49,41.5,52,45.5)StudentData2.3结果展示3.1问题叙述某单位对100名女生测定血清总蛋白含量(g/L),数据如下:74.379.968.878.070.480.580.569.771.273.579.575.675.078.872.072.072.074.371.272.075.073.578.874.3
5、75.865.074.371.269.768.073.575.072.064.375.880.369.774.373.573.575.875.868.876.570.471.281.275.070.468.070.472.076.574.376.577.667.372.075.074.373.579.573.574.765.076.581.675.472.772.767.276.572.770.477.268.867.367.367.372.775.873.575.073.573.573.572.781.670.374.373.579.570.476.572.777.284.375.076.5
6、70.4绘制上述数据的直方图、密度估计曲线、经验分布图和QQ图.3.2问题求解3.2.1运用hist函数绘制直方图;hist(serumdata,freq=FALSE,col=purple,border=red,density=3,angle=60,main=paste(the histogram of serumdata),xlab=age,ylab=frequency)3.2.2运用lines函数绘制密度估计曲线;lines(density(serumdata),col=blue)3.2.3运用plot函数绘制经验分布图;x lines(x,dnorm(x,mean(serumdata),
7、sd(serumdata),col=green) plot(ecdf(serumdata),verticals=TRUE,do.p=FALSE) lines(x,pnorm(x,mean(serumdata),sd(serumdata),col=blue)3.2.4运用qqnorm函数绘制QQ图qqnorm(serumdata,col=purple)qqline(serumdata,col=red)3.3结果展示直方图密度估计曲线经验分布图QQ图4.1问题叙述甲、乙两种稻谷分别播种在10块试验田中,每块实验田甲乙稻谷各种一半.假设两稻谷产量X,Y均服从正态分布,且方差相等.收获后10块试验田的
8、产量如下所示(单位:千克)甲种140137136140145148140135144141乙种135118115140128131130115131125求出两稻种产量的期望差 的置信区间( ).4.2问题求解4.2.1创建x、y数据框 x x 1 140 137 136 140 145 148 140 135 144 141 y y 1 135 118 115 140 128 131 130 115 131 1254.2.2运用t.test函数求解 t.test(x,y,var.equal=TRUE)4.3结果展示由以上程序运行得两稻种产量的期望差的95%置信区间为 7.53626, 20.
9、06374.5.1问题叙述甲乙两组生产同种导线,现从甲组生产的导线中随机抽取4根,从乙组生产的导线中随机抽取5根,它们的电阻值(单位: )分别为甲组0.1430.1420.1430.137乙组0.1400.1420.1360.1380.140假设两组电阻值分别服从正态分布 未知.试求的置信区间系数为0.95的区间估计.5.2问题求解5.2.1创建x、y数据框 x y t.test(x,y,var.equal=TRUE)5.3结果展示 Two Sample t-testdata: x and yt = 1.198, df = 7, p-value = 0.2699alternative hypo
10、thesis: true difference in means is not equal to 095 percent confidence interval: -0.001996351 0.006096351sample estimates:mean of x mean of y 0.14125 0.13920由以上程序运行甲乙两电阻的期望差的95%置信区间为-0.001996351, 0.006096351.6.1问题叙述已知某种灯泡寿命服从正态分布,在某星期所生产的该灯泡中随机抽取10只,测得其寿命(单位:小时)为1067 919 1196 785 1126 936 918 1156
11、920 948求这个星期生产出的灯泡能使用1000小时以上的概率.6.2问题求解6.2.1创建x数据框 x=c(1067,919,1196,785,1126,936,918,1156,920,948) x6.2.2运用pnorm函数求解 pnorm(1000,mean(x),sd(x)1 0.50879416.3结果展示由以上程序运行得,x=1000的概率为0.509,故x大于1000的概率为0.491.三、实验总结在R语言实验学习中,通过实验操作可使我们加深对理论知识的理解,学习和掌握R语言的基本方法,并能进一步熟悉和掌握R软件的操作方法,培养我们分析和解决实际问题的基本技能,提高我们的综合素质.
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1