研究生R语言考题.docx
《研究生R语言考题.docx》由会员分享,可在线阅读,更多相关《研究生R语言考题.docx(22页珍藏版)》请在冰豆网上搜索。
研究生R语言考题
暨南大学考试试卷
教
师
填
写
2010-2011_学年度第____2___学期
课程名称:
数据分析与R语言应用
授课教师姓名:
________王斌会______________
考试时间:
__2011__年__11__月___8___日
课程类别
必修[]选修[√]
考试方式
开卷[√]闭卷[]
试卷类别(A、B)
[A]共4页
考
生
填
写
经济学院学院(校)数量经济学专业班(级)
姓名刘伟学号08内招[]外招[]
题号
一
二
三
四
五
六
七
八
九
十
总分
得分
得分
评阅人
一、统计图表(共1小题,共20分)
1.应用R图表对各类产品供货走势图分析
类别\月份
1
2
3
4
5
6
7
8
9
10
11
12
彩电A1
冰箱A2
空调A3
洗衣机A4
(1)要求:
数据由R随机数函数生成,产生[20,50]间的均匀随机数。
解:
首先对R进行初始化,设定参数,再生成随机数,代码如下:
rm(list=ls())
options(digits=4)
par(mar=c(4,4,2,1)+0.1,cex=0.75)
A1=runif(12,20,50);A1
A2=runif(12,20,50);A2
A3=runif(12,20,50);A3
A4=runif(12,20,50);A4
(2)分析(图形要进行一定修饰):
1)绘制各类产品的月份趋势线图。
解:
趋势线图如下
代码如下:
par(mfrow=c(2,2))
plot(A1,type="l",ylab="销售量",xlab="月份",main="彩电(A1)",xlim=c(1,12),ylim=c(0,50))
plot(A2,type="l",ylab="销售量",xlab="月份",main="冰箱(A2)",xlim=c(1,12),ylim=c(0,50))
plot(A3,type="l",ylab="销售量",xlab="月份",main="空调(A3)",xlim=c(1,12),ylim=c(0,50))
plot(A4,type="l",ylab="销售量",xlab="月份",main="洗衣机(A4)",xlim=c(1,12),ylim=c(0,50))
2)绘制各类产品的季度的柱形图。
解:
首先对数据进行整理,得出各自的季度数据。
柱状图如下
代码如下:
dat=data.frame(A1,A2,A3,A4)
q1=c(dat[1,1]+dat[2,1]+dat[3,1],dat[4,1]+dat[5,1]+dat[6,1],dat[7,1]+dat[8,1]+dat[9,1],
dat[10,1]+dat[11,1]+dat[12,1])
q2=c(dat[1,2]+dat[2,2]+dat[3,2],dat[4,2]+dat[5,2]+dat[6,2],dat[7,2]+dat[8,2]+dat[9,2],
dat[10,2]+dat[11,2]+dat[12,2])
q3=c(dat[1,3]+dat[2,1]+dat[3,3],dat[4,3]+dat[5,1]+dat[6,3],dat[7,3]+dat[8,3]+dat[9,3],
dat[10,3]+dat[11,3]+dat[12,3])
q4=c(dat[1,4]+dat[2,4]+dat[3,4],dat[4,4]+dat[5,4]+dat[6,4],dat[7,4]+dat[8,4]+dat[9,4],
dat[10,4]+dat[11,4]+dat[12,4])
dat1=data.frame(q1,q2,q3,q4);dat1
par(mfrow=c(2,2))
barplot(dat1[,1],xlab="季度",ylab="销售量",main="彩电(A1)",ylim=c(0,150))
barplot(dat1[,2],xlab="季度",ylab="销售量",main="冰箱(A2)",ylim=c(0,150))
barplot(dat1[,3],xlab="季度",ylab="销售量",main="空调(A3)",ylim=c(0,150))
barplot(dat1[,4],xlab="季度",ylab="销售量",main="洗衣机(A4)",ylim=c(0,150))
3)绘制各类产品的年度的饼图。
解:
饼图如下
代码如下:
par(mfrow=c(1,1))
y1=dat1[1,1]+dat1[2,1]+dat1[3,1]+dat1[4,1]
y2=dat1[1,2]+dat1[2,2]+dat1[3,2]+dat1[4,2]
y3=dat1[1,3]+dat1[2,3]+dat1[3,3]+dat1[4,3]
y4=dat1[1,4]+dat1[2,4]+dat1[3,4]+dat1[4,4]
x=c(y1,y2,y3,y4)
pie(x,,labels=c("彩电(A1)","冰箱(A2)","空调(A3)","
洗衣机(A4)"),col=c("red","green","purple","blue"))
得分
评阅人
二、统计检验(共2小题,每题10分,共20分)
1.两台铣床生产同一种型号的套管,平日两台铣床加工的套管内槽深度都服从正态分布N(10,0.32)和N(8,0.22),从这两台铣床的产品中分别抽出13个和15个,请分别按方差已知和未知检验两台产品的深度是否不同(α=0.05)?
(1)两台铣床的产品内槽精度(方差)有无显著差别?
解:
x=rnorm(13,10,0.3)
y=rnorm(15,8,0.2)
var.test(x,y)
Ftesttocomparetwovariances
data:
xandy
F=3.899,numdf=12,denomdf=14,p-value=
0.01785
alternativehypothesis:
trueratioofvariancesisnotequalto1
95percentconfidenceinterval:
1.27812.502
sampleestimates:
ratioofvariances
3.899
由于p-value=0.01785<0.05,故两台铣床的产品内槽精度(方差)有显著差别。
(2)两台产品的的深度是否不同?
解:
1、方差未知时
t.test(x,y)
WelchTwoSamplet-test
data:
xandy
t=17.61,df=17.2,p-value=1.934e-12
alternativehypothesis:
truedifferenceinmeansisnotequalto0
95percentconfidenceinterval:
1.6052.042
sampleestimates:
meanofxmeanofy
9.9828.159
由于p-value=1.934e-12<0.05,故两台产品的的深度是不同的。
2、方差已知时
u.test=function(x,y,sigmax,sigmay){
nx=length(x)
ny=length(y)
xbar=mean(x)
ybar=mean(y)
u=(xbar-ybar)/sqrt(sigmax^2/nx+sigmay^2/ny)
p=pnorm(u,lower.tail=F)
c(u=u,p=p)
}
u.test(x,y,0.3,.02)
up
2.187e+012.332e-106
由于p=2.332e-106<0.05,故两台产品的的深度是不同的。
2.如果还有一台铣床生产同一种型号的套管,其加工的套管内槽深度都服从正态分布N(12,0.42),从这台铣床的产品中抽出18个,请分别按方差已知和未知检验三台产品的深度是否不同(α=0.05)?
(1)、方差已知的情况
x1=rnorm(13,10,0.3)
x2=rnorm(15,8,0.2)
x3=sample(rnorm(1000,12,0.4),18)
n1=length(x1)
n2=length(x2)
n3=length(x3)
se1=sqrt(0.3^2/n1+0.2^2/n2)
se2=sqrt(0.3^2/n1+0.4^2/n3)
se3=sqrt(0.2^2/n2+0.4^2/n3)
x1bar=mean(x1)
x2bar=mean(x2)
x3bar=mean(x3)
u1=(x1bar-x2bar)/se1
u2=(x1bar-x3bar)/se3
u3=(x2bar-x3bar)/se3
chi=u1^2+u2^2+u3^2
p=2*pchisq(chi,3,lower.tail=F);p
P(2)、方差未知的情况
y=c(x1,x2,x3)
group=c(rep(1,13),rep(2,15),rep(3,18))
oneway.test(y~group)
One-wayanalysisofmeans(notassumingequalvariances)
data:
yandgroup
F=564.7,numdf=2.00,denomdf=28.28,p-value<2.2e-16
P得分
评阅人
三、统计建模(共1小题,共20分)
为了解百货商店销售额x与流通费率y(这是反映商业活动的一个质量指标,指每元商品流转额所分摊的流通费用)之间的关系,收集25个商店的有关数据,这里假定x来自[10,30]上的均匀随机数,e~N(0,0.32)的正态随机数。
(1)设y=2+3*x+e,试用R拟合y=a+bx的线性回归模型
解:
x=runif(25,10,30)
e=rnorm(25,0,0.3)
y=c(2+3*x+e)
fm=lm(y~x)
fm
Call:
lm(formula=y~x)
Coefficients:
(Intercept)x
2.063.00
故y=2.06+3.00x.
(2)设y=2+3*ln(x)+e,试用R拟合y=a+bln(x)的对数回归模型
解:
x=runif(25,10,30)
e=rnorm(25,0,0.3)
y=c(2+3*log(x)+e)
fm=lm(y~x)
fm
Call:
lm(formula