R命令速查手册.docx
《R命令速查手册.docx》由会员分享,可在线阅读,更多相关《R命令速查手册.docx(18页珍藏版)》请在冰豆网上搜索。
R命令速查手册
R语言命令速查手册
一、R的安装载入与帮助查询-2-
二、数据对象的类型与建立-2-
三、数据的浏览与编辑-2-
四、数据的运算-3-
五、数据的存储与读取-3-
六、程序命令-4-
七、绘图函数-4-
八、绘图参数-5-
九、常用概率分布命令-6-
十、基本统计分析函数-7-
R语言命令速查手册
一、R的安装载入与帮助查询
命令
解释
1
install.packages(“程序包”)
安装指定程序包
2
library(“程序包”)
载入指定程序包(已安装)
3
help.start()
R基本知识的查询
4
help(函数)或?
(函数)
获取指定函数的帮助页面
5
help(“字符”)
获取指定字符的帮助页面,选项try.all.packages=FALSE/TRUE,或package=“程序包”
6
apropos(“字符”)或apropos(字符)
找出所有名中含指定字符的函数
7
help.search(“字符”)
列出所有在帮助页面含指定字符的函数
8
find(函数)或find(“函数”)
得到含指定函数的程序包
9
args(函数)或args(“函数”)
得到含指定函数的自变量列表
二、数据对象的类型与建立
类型
建立命令
解释
向量
seq(from=,to=,by=)或:
产生较简单的序列
rep()
通过重复产生复杂序列
c()
无规律的向量
scan()
通过键盘逐个输入
因子
factor(x,levels=sort(unique(x),na.last=TRUE),labels=levels,exclude=NA,ordered=is.ordered(x))
levels指定水平,labels指定水平名字,exclude剔除水平值,ordered水平是否排序
gl(k,n)
产生k个水平的因子序列,每个水平重复n次,选项length=个数,label=因子名.
数组
array(data,dim=向量,dimnames=向量)
data为构建数组之数据,dim为维数向量,dimnames为各维名称
矩阵
matrix(data,row,col)
选项byrow=FALSE按列填充,rownames(),colnames()给行列赋名
diag()
提取对角元
t()转置,diag()提对角元,rbind()按行合并,cbind()按列合并,*逐元乘积,%*%代数积,det()方阵行列式,
数据框
data.frame(变量名=数据,变量名=数据)
with(数据集,新变量)
在原数据框中添加新变量
transform(数据集,新变量1,新变量2)
一次性添加多个新定义变量
subset(data,条件)
提取满足条件的子集
列表
list(x,y,z)
不同类型的数据x,y,z…组成的对象
时间序列
ts(data=NA,start=1,end=numeric(0),frequency=1,deltat=1,ts.eps=getOption(“ts.eps”),class,names)
三、数据的浏览与编辑
命令
解释
1
head(数据集)
显示数据集的前6个观测值
2
tail(数据集)
显示数据集的后6个观测值
3
names(数据集)
显示数据集中的变量
4
data.entry(数据集)
通过数据编辑器打开数据集(可编辑)
5
edit(数据集)
通过数据编辑器编辑数据集
6
fix(数据集)
通过数据编辑器编辑数据集
7
attach(数据集)
激活或挂接数据集,使之成为当前数据集
8
detach(数据集)
卸载或挂起当前数据集
9
ls()
显示所有在内存中的对象,选项pat=“字符”只显示名称带指定字符的对象
10
ls.str()
显示内存中所有对象的详细信息,选项max.level=-1规定详细级别
11
rm(对象)
删除内存中的对象
四、数据的运算
+加法
<小于
!
x逻辑非
-减法
>大于
x&y逻辑与
*乘法(逐元乘积)
<=小于或等于
x&&y逻辑与(只作用第一个元素)
/除法
>=大于或等于
x|y逻辑或
^乘方
==等于
x||y逻辑或(只作用第一个元素)
%%模
!
=不等于
xor(x,y)异或
%/%整除
t(矩阵)矩阵转置
det(A)方阵的行列式
%*%矩阵的代数积
rbind(A,B)按行合并矩阵
cbind(A,B)按列合并矩阵
apply(X,MARGIN=,FUN=)对X按MARGIN采取FUN运算,MARGIN=1按列,=2按行
sweep(X,MARGIN,STATS,FUN)对X按MARGIN采取FUN计算STATS,并从X中除去
五、数据的存储与读取
命令
解释
write.table(数据,file=“存储路径”)
保存为文本文件.txt,选项row.names=F行名不写入文件,quote=F变量名不放双引号中
write.csv(数据,file=“存储路径”)
保存为用逗号分割的文本文件.csv
save(数据,file=“存储路径”)
保存为R格式文件.Rdata
save.image()
保存工作空间的映像
read.table(“文件地址”)
读取表格形式数据,选项header=TRUE将第一行作为表头行
read.csv()或read.csv2()
读取用逗号分割的数据
read.delim()或read.delim2()
读取用其他分割符分割的数据
scan(“文件名”,what=list(变量名=变量类型))
what=为名义列表,可直接命名对象
read.fwf(“文件地址”,widths=向量,col.names=向量)
读取文件中固定宽度格式的数据
Excel数据读取:
先Ctrl+C复制内容,再用命令read.delim(“clipboard”)
Excel数据读取:
library(RODBC)再z<-odbcConnectExcel(“Excel文件地址”)再sqlFetch(z,“Sheet1”),close(z)
data()
列出R的全部数据集
data(数据集,package=“程序包”)
载入指定程序包中指定数据集
load(“R文件地址”)
重新加载R数据
六、程序命令
1
if(条件)表达式1else表达式2
2
ifelse(条件,满足执行语句,否则执行)
3
for(变量in向量)表达式
4
while(条件)表达式
5
repeat表达式if(条件)break
6
函数名=function(参数列表){函数体}
七、绘图函数
命令
解释
1
plot(x)
以序号为横坐标,以x的元素值为纵坐标绘图
2
plot(x,y)
以x为横y为纵坐标绘图
3
sunflowerplot(x,y)
以x为横y为纵坐标绘图,相似坐标的点为花朵,花瓣数目为点的个数
4
pie(x)
饼图
5
boxplot(x)
箱形图
6
stripchart(x)
将x的值画在一条线段上
7
coplot(x~y|z)
关于z的每个值绘x与y的二元图
8
interaction.plot(f1,f2,y)
以f1为x轴,f2的不同值对应不同曲线,作y的均值图,选项fun=函数,指定y的其他统计量
9
matplot(x,y)
x与y的相应列匹配作二元图,各图在同一作图区域上
10
dotchart(x)
若x是数据框,作Cleveland点图(逐行逐列累加图)
11
fourfoldplot(x)
用四个四分之一圆显示2×2列联表情况
12
assocplot(x)
Cohen-Friendly图,显示在二维列联表中行、列变量偏离独立性的程度
13
mosaicplot(x)
列联表的对数线性回归残差的马赛克图
14
pairs(x)
如果x是矩阵或数据框,作x的各列之间的二元图
15
plot.ts(x)
作x的时间序列曲线,x多元时须有相同的频率和时间
16
ts.plot(x)
作x的时间序列曲线,x多元时须有相同的频率
17
hist(x,probability=T)
x的频率直方图
18
barplot(x)
x的条形图
19
qqnorm(x)
正态分位数-分位数图
20
qqplot(x,y)
y对x的分位数-分位数图
21
contour(x,y,z)
等高线图,x、y须为向量,z为矩阵dim(z)=c(length(x),length(y))
22
filled.contour(x,y,z)
等高线之间的区域是彩色的
23
image(x,y,z)
同上,实际数据大小用不同色彩表示
24
persp(x,y,z)
同上,但为透视图
25
stars(x)
若x是矩阵或数据框,星形和线段画出
26
symbols(x,y,…)
在由x和y给定坐标画符号
27
termplot(mod.obj)
回归模型(mod.obj)的(偏)影响图
28
points(x,y)
添加点
29
lines(x,y)
添加线
30
text(x,y,labels,)
在(x,y)处添加labels指定的文字
31
mtext(text,side=3,line=0,…)
在边空添加用text指定的文字,side指定添加在哪边,line指定添加文字距绘图区域的行数
32
segments(x0,y0,x1,y1)
从(x0,y0)到(x1,y1)画线段
33
arrows(x0,y0,x1,y1,angle=30,code=2)
同上,code=1,箭头从(x0,y0)到(x1,y1),code=2,(x1,y1)到(x0,y0),code=3,两端都有.
34
abline(a,b)
斜率为b截距为a的直线
35
abline(h=y)
水平线
36
abline(v=x)
垂直线
37
abline(lm.obj)
由lm.obj确定的回归线
38
rect(x1,y1,x2,y2)
绘长方形
39
polygon(x,y)
绘多边形
40
legend(x,y,legend=“”)
在(x,y)处添加图例
41
title()
添加标题
42
axis(side,…)
画坐标轴,side=1画在下边,side=2左边,side=3上边,side=4右边
43
box()
当前图上加边框
44
rug(x)
在x轴上用短线标出x数据的位置
45
locator(n,type=“n”,…)
鼠标点击n次后返回n个位置的坐标,并按type划点或线
46
text(x,y,expression(表达式))
在图上加数学表达式
47
text(x,y,as.expression(substitute(表达式,参数值)))
在表达式中代入某个变量值
48
curve(x)
画曲线
49
persp(x)
三维透视图
八、绘图参数
命令
解释
1
add=FALSE
TRUE时表叠加图形到前一个图上
2
axes=TRUE
FALSE时不绘制轴与边框
3
type=“p”
指定图形的类型.p:
点,l:
线,b:
点连线,o:
点连线,线在点上,h:
垂直线,s:
阶梯式,垂直线顶端显示数据,S:
垂直线底端显示数据
4
xlim=,ylim=
指定轴的上下限
5
xlab=,ylab=
坐标轴的标签,字符型值
6
main=
主标题,字符型值
7
sub=
副标题
8
adj=
控制文字对齐方式.0:
左对齐,0.5:
居中,1:
右对齐
9
bg=“”
指定背景色
10
bty=“”
控制图形边框形状.“o”,“l”,“7”,“”c,“u”,“]”
11
cex
控制符号和文字大小.拓展:
cex.axis,cex.lab,cex.main,cex.sub
12
col
控制符号颜色
13
font
控制文字字体.1:
正常,2:
斜体,3:
粗体,4:
粗斜体
14
las
控制坐标轴刻度数字标记方向.0:
平行于轴,1:
横排,2:
垂直于轴,3:
竖排
15
lty
控制连线线型.1:
实线,2:
虚线,3:
点线,4:
点虚线,5:
长虚线,6:
双虚线,
16
lwd
控制连线宽度的数字
17
mar
控制图形边空.c(bottom,left,top,right)四个值
18
mfcol=c(nr,nc)
c(nr,nc)向量分割窗口,按列使用子窗口
19
mfrow=c(nr,nc)
c(nr,nc)向量分割窗口,按行使用子窗口
20
pch=1:
25
控制符号类型.1:
25种样式
21
ps
控制文字大小的整数
22
pty
指定绘图区域类型的字符.“s”正方形,“m”最大利用
23
tck
指定轴上刻度长度值(百分比),以图形宽、高中最小一个作基数
24
tcl
同上,但以文本行高度为基数
25
xaxt=
“n”设置x轴但不显示
26
yaxt=
“n”设置y轴但不显示
27
par()
后续图形按par中设定参数绘制
九、常用概率分布命令
分布密度
R命令(d,p,q,r)
参数
Beta
_beta
shape1,shape2
Binomial
_binom
size,prob
Cauchy
_cauchy
location=0,scale=1
Chi-sqaured
_chisq
df,ncp
Dirichlet
_dirichlet
alpha
Exponential
_exp
rate
Fisher-Snedecor
_f
df1,df2,ncp
Gamma
_gamma
shape,scale=1
Geometric
_geom
prob
GeneralizedExtremeValue
_gev
xi,mu,sigma
GeneralizedPareto
_gpd
xi=1,mu=0,sigma=1
Hypergeometric
_hyper
m,n,k
InverseGamma
_invgamma
shape,rate
InverseWishart
_iwish
v,S
Logistic
_logis
location=0,scale=1
Lognormal
_lnorm
meanlog=0,sdlog=1
Multinomial
_multinom
size,prob
MultivariateNormal
_mvnorm
mean,sigma
Multivariate-t
_mvt
sigma=diag
(2),df=1
Negativebinomial
_nbinom
size,prob
Normal
_norm
mean=0,sd=1
Poisson
_pois
lambda
Student’s
_t
df
Uniform
_unif
min=0,max=1
Weibull
_weibull
shape,scale=1
Wilcoxon’sstatistics
_wilcox
_signrank
m,n
n
Wishart
_wish
v,S
一十、基本统计分析函数
命令
解释
1
max(x)
返回向量x中最大元
2
min(x)
返回向量x中最小元
3
which.max(x)
返回x最大元的下标
4
which.min(x)
返回x最小元的下标
5
mean(x)
计算样本x的均值
6
median(x)
计算样本x的中位数
7
mad(x)
计算中位绝对离差1.4826median(abs(x-median(x)))
8
var(x)
计算样本x的方差
9
sd(x)
计算样本x的标准差
10
range(x)
返回向量c(min(x),max(x))
11
IQR(x)
计算样本x的四分位数极差
12
quantile(x)
计算样本x的常用分位数
13
summary(x)
计算样本x的常用描述性统计量(五数概括)
14
length(x)
返回向量x的长度
15
mode(x)
返回对象x的类型
16
sum(x)
给出向量x的总和
17
prod(x)
给出向量x的乘积
18
rev(x)
取向量x的逆序
19
sort(x)
按升序排序,选项decreasing=TRUE表降序
20
order(x)
返回x的秩(升序),选项decreasing=TRUE表降序
21
rank(x)
返回x的秩
22
cumsum(x)
返回向量x的累积和
23
cumprod(x)
返回向量x的累积积
24
cumin(x)
返回向量x的累积最小值
25
cummax(x)
返回向量x的累积最大值
26
var(x,y)
计算样本x,y的协方差
27
cov(x,y)
计算样本x,y的协方差
28
cor(x,y)
计算样本x,y的相关系数
29
outer(x,y)
计算样本x,y的外积
30
sample(x,n)
从样本x中抽取n个个体,选项replace=TRUE表有放回抽样,prob=y表x中元素出现的概率
31
choose(n,k)
从n中抽k个组合
32
density(x,bw=,kernel=“”)
x的核密度估计,bw为窗宽,kernel为选择光滑化函数
33
kde2d(x,y)
MASS程序包中二维核密度估计
34
hist(x,breaks=“”,freq=T)
x的频数直方图
35
stem(x)
茎叶图
36
skewness(x)
样本的偏度系数(需加载fBasics程序包)
37
kurtosis(x)
样本的峰度系数(需加载fBasics程序包)
38
basicStats(x)
fBasics包中的命令,计算常用的统计特征量
39
lowess()或loesss()
用一条非线性曲线拟合散点图
40
aggregate(数据框,分组变量,函数)
对数据框的指定分组变量按指定函数统计分析
41
optimize(f=,interval=,maximum=TRUE,…)
单参数的极大似然估计(求单变量极值)
42
optim(par,fn,gr=NULL,method=c(“Nelder-Mead”,“BFGS”,“CG”,“L-BFGS-B”,“SANN”),…)
按选用的method求多元函数极值(多维极大似然估计)
43
nlm(f,p,hessian=FALSE,typsize=rep(1,length(p)),fscale=1,…)
使用牛顿-拉夫逊算法求函数的最小值点
44
t.test(x,y,alternative=c(“two.sided”,“less”,“greater”),mu=0,paired=FALSE,var.equal=FALSE,conf.level=0.95,…)
方差未知时均值的区间估计与假设检验
45
var.test(x,y,ratio=1,alternative=c(“two.sided”,“less”,“greater”),conf.level=0.95,…)
两正态总体方差比的区间估计与假设检验
46
prior.norm(mean=,cov=,trendsd=0)
evdbayes包中产生三参数(位置、尺度、形状)服从三维正态的先验分布
47
prior.prob(quant,alpha,trendsd=0)
evdbayes包中产生Beta分布参数的先验分布
48
prior.quant(prob=10^-(1:
3),shape,scale,trendsd=0)
evdbayes包中产生Gamma分布参数的先验分布
49
posterior(n,init,prior,lh=c("none","gev","gpd","pp","os"),...,psd,
burn=0,thin=1)
evdbayes包中产生参数的后验分布,n迭代次数,init为初始迭代值,prior为先验分布,lh为极大似然函数适用分布,有gev,gpd,pp,os,none,psd为建议分布标准差,
50
hill(data,option=c("alpha","xi","quantile"),start=15,end=NA,reverse=FALSE,p=NA,ci=0.95,auto.scale=TRUE,labels=TRUE,...)
evir包中hill估计
51
gpd(data,threshold=NA,nextremes=NA,method=c("ml","pwm"),information=c("observed","expected"),...)
evir包中GPD分布估计,threshold=阈值,nextremes=k(第k大次序量位置),两者选一.method=c("ml","pwm")中ml表极大似然方法,pwm表概率权矩方法,
52
plot.gpd(gpd(data,threshold=))或plot(gpd(data,threshold=))
(evir包)四选项:
选1画超出量分布,2画底分布的尾,3残差图4残差的QQ图0退出
53
tailplot(x,optlog=NA,extend=1.5,labels=TRUE,...)
evir包中画底分布的尾,x为gpd产生数据,optlog=“x”x轴取对数,“y”y轴取对数,“xy”xy都取对数,
54
quant(data,p=0.99,models=30,start=15,end=500,reverse=TRUE,ci=0.95,auto.scale=TRUE,labels=TRUE,...)
evir包中GPD高分位数估计图
55
shape(data,models=30,start