R语言实验报告习题详解.docx
《R语言实验报告习题详解.docx》由会员分享,可在线阅读,更多相关《R语言实验报告习题详解.docx(11页珍藏版)》请在冰豆网上搜索。
R语言实验报告习题详解
R语言实验报告
习题详解
学院:
班级:
学号:
姓名:
导师:
成绩:
一、实验目的
R是用于统计分析、绘图的语言和操作环境。
R是属于GNU系统的一个自由、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具;
本次试验要求掌握了解R语言的各项功能和函数,能够通过完成试验内容对R语言有一定的了解,会运用软件对数据进行分析;
通过本实验加深对课本知识的理解以及熟练地运用R语言软件来解决一些复杂的问题。
二、实验内容
1.1问题叙述
将1,2,…,20构成两个4×5阶的矩阵,其中矩阵A是按列输入,矩阵B是按行输入,并做如下运算.
C=A+B;
D=A*B;
F是由A的前3行和前3列构成的矩阵;
G是由矩阵B的各列构成的矩阵,但不含B的第3列.
1.2问题求解
1.2.1创建按列、行输入的4×5矩阵;
A<-matrix(1:
20,c(4,5))
A
B<-matrix(1:
20,nrow=4,byrow=TRUE)
B
1.2.2编写程序求解
A<-matrix(1:
20,c(4,5))
A
B<-matrix(1:
20,nrow=4,byrow=TRUE)
B
C=A+B
C
D=A*B
D
F<-A[1:
3,1:
3]
F
H<-matrix(c(1,2,4,5),nrow=1)
H
G<-B[,H]
G
1.3结果展示
2.1问题叙述
已知有5名学生的数据,如下表所示.用数据框的形式读入数据.
学生数据
序号
姓名
性别
年龄
身高(cm)
体重(kg)
1
张三
女
14
156
42.0
2
李四
男
15
165
49.0
3
王五
女
16
157
41.5
4
赵六
男
14
162
52.0
5
丁一
女
15
159
45.5
2.2问题求解
2.2.1创建StudentData数据框
StudentData<-data.frame(name=c("zhangsan","lisi","wangwu","zhaoliu","dingyi"),sex=c("F","M","F","M","F"),age=c("14","15","16","14","15"),height=c("156","165","157","162","159"),weight=c("42","49","41.5","52","45.5"))
2.2.2运行程序求解
StudentData<-data.frame(name=c("zhangsan","lisi","wangwu","zhaoliu","dingyi"),sex=c("F","M","F","M","F"),age=c("14","15","16","14","15"),height=c("156","165","157","162","159"),weight=c("42","49","41.5","52","45.5"))
StudentData
2.3结果展示
3.1问题叙述
某单位对100名女生测定血清总蛋白含量(g/L),数据如下:
74.3
79.9
68.8
78.0
70.4
80.5
80.5
69.7
71.2
73.5
79.5
75.6
75.0
78.8
72.0
72.0
72.0
74.3
71.2
72.0
75.0
73.5
78.8
74.3
75.8
65.0
74.3
71.2
69.7
68.0
73.5
75.0
72.0
64.3
75.8
80.3
69.7
74.3
73.5
73.5
75.8
75.8
68.8
76.5
70.4
71.2
81.2
75.0
70.4
68.0
70.4
72.0
76.5
74.3
76.5
77.6
67.3
72.0
75.0
74.3
73.5
79.5
73.5
74.7
65.0
76.5
81.6
75.4
72.7
72.7
67.2
76.5
72.7
70.4
77.2
68.8
67.3
67.3
67.3
72.7
75.8
73.5
75.0
73.5
73.5
73.5
72.7
81.6
70.3
74.3
73.5
79.5
70.4
76.5
72.7
77.2
84.3
75.0
76.5
70.4
绘制上述数据的直方图、密度估计曲线、经验分布图和QQ图.
3.2问题求解
3.2.1运用hist函数绘制直方图;
hist(serumdata,freq=FALSE,col="purple",border="red",density=3,angle=60,main=paste("thehistogramofserumdata"),xlab="age",ylab="frequency")
3.2.2运用lines函数绘制密度估计曲线;
lines(density(serumdata),col="blue")
3.2.3运用plot函数绘制经验分布图;
x<-64:
85
>lines(x,dnorm(x,mean(serumdata),sd(serumdata)),col="green")
>plot(ecdf(serumdata),verticals=TRUE,do.p=FALSE)
>lines(x,pnorm(x,mean(serumdata),sd(serumdata)),col="blue")
3.2.4运用qqnorm函数绘制QQ图
qqnorm(serumdata,col="purple")
qqline(serumdata,col="red")
3.3结果展示
直方图
密度估计曲线
经验分布图
QQ图
4.1问题叙述
甲、乙两种稻谷分别播种在10块试验田中,每块实验田甲乙稻谷各种一半.假设两稻谷产量X,Y均服从正态分布,且方差相等.收获后10块试验田的产量如下所示(单位:
千克)
甲种
140
137
136
140
145
148
140
135
144
141
乙种
135
118
115
140
128
131
130
115
131
125
求出两稻种产量的期望差
的置信区间(
).
4.2问题求解
4.2.1创建x、y数据框
>x<-c(140,137,136,140,145,148,140,135,144,141)
>x
[1]140137136140145148140135144141
>y<-c(135,118,115,140,128,131,130,115,131,125)
>y
[1]135118115140128131130115131125
4.2.2运用t.test函数求解
>t.test(x,y,var.equal=TRUE)
4.3结果展示
由以上程序运行得两稻种产量的期望差
的95%置信区间为[7.53626,20.06374].
5.1问题叙述
甲乙两组生产同种导线,现从甲组生产的导线中随机抽取4根,从乙组生产的导线中随机抽取5根,它们的电阻值(单位:
)分别为
甲组
0.143
0.142
0.143
0.137
乙组
0.140
0.142
0.136
0.138
0.140
假设两组电阻值分别服从正态分布
未知.试求
的置信区间系数为0.95的区间估计.
5.2问题求解
5.2.1创建x、y数据框
>x<-c(0.143,0.142,0.143,0.137)
>y<-c(0.140,0.142,0.136,0.138,0.140)
5.2.2运用t.test函数求解
>t.test(x,y,var.equal=TRUE)
5.3结果展示
TwoSamplet-test
data:
xandy
t=1.198,df=7,p-value=0.2699
alternativehypothesis:
truedifferenceinmeansisnotequalto0
95percentconfidenceinterval:
-0.0019963510.006096351
sampleestimates:
meanofxmeanofy
0.141250.13920
由以上程序运行甲乙两电阻的期望差
的95%置信区间为[-0.001996351,0.006096351].
6.1问题叙述
已知某种灯泡寿命服从正态分布,在某星期所生产的该灯泡中随机抽取10只,测得其寿命(单位:
小时)为
1067919119678511269369181156920948
求这个星期生产出的灯泡能使用1000小时以上的概率.
6.2问题求解
6.2.1创建x数据框
>x=c(1067,919,1196,785,1126,936,918,1156,920,948)
>x
6.2.2运用pnorm函数求解
>pnorm(1000,mean(x),sd(x))
[1]0.5087941
6.3结果展示
由以上程序运行得,x<=1000的概率为0.509,故x大于1000的概率为0.491.
三、实验总结
在R语言实验学习中,通过实验操作可使我们加深对理论知识的理解,学习和掌握R语言的基本方法,并能进一步熟悉和掌握R软件的操作方法,培养我们分析和解决实际问题的基本技能,提高我们的综合素质.