R命令速查手册.docx

资源描述

R命令速查手册.docx

《R命令速查手册.docx》由会员分享，可在线阅读，更多相关《R命令速查手册.docx（18页珍藏版）》请在冰豆网上搜索。

R命令速查手册.docx

R命令速查手册

R语言命令速查手册

一、R的安装载入与帮助查询-2-

二、数据对象的类型与建立-2-

三、数据的浏览与编辑-2-

四、数据的运算-3-

五、数据的存储与读取-3-

六、程序命令-4-

七、绘图函数-4-

八、绘图参数-5-

九、常用概率分布命令-6-

十、基本统计分析函数-7-

R语言命令速查手册

一、R的安装载入与帮助查询

命令

解释

install.packages（“程序包”）

安装指定程序包

library（“程序包”）

载入指定程序包（已安装）

help.start（）

R基本知识的查询

help（函数）或?

（函数）

获取指定函数的帮助页面

help（“字符”）

获取指定字符的帮助页面,选项try.all.packages=FALSE/TRUE,或package=“程序包”

apropos（“字符”）或apropos（字符）

找出所有名中含指定字符的函数

help.search（“字符”）

列出所有在帮助页面含指定字符的函数

find（函数）或find（“函数”）

得到含指定函数的程序包

args（函数）或args（“函数”）

得到含指定函数的自变量列表

二、数据对象的类型与建立

类型

建立命令

解释

向量

seq（from=,to=,by=）或：

产生较简单的序列

rep（）

通过重复产生复杂序列

c（）

无规律的向量

scan（）

通过键盘逐个输入

因子

factor（x,levels=sort（unique（x）,na.last=TRUE）,labels=levels,exclude=NA,ordered=is.ordered（x））

levels指定水平,labels指定水平名字,exclude剔除水平值,ordered水平是否排序

gl（k,n）

产生k个水平的因子序列,每个水平重复n次,选项length=个数,label=因子名.

数组

array（data,dim=向量,dimnames=向量）

data为构建数组之数据,dim为维数向量,dimnames为各维名称

矩阵

matrix（data,row,col）

选项byrow=FALSE按列填充，rownames（）,colnames（）给行列赋名

diag（）

提取对角元

t（）转置,diag（）提对角元,rbind（）按行合并,cbind（）按列合并,*逐元乘积,%*%代数积,det（）方阵行列式,

数据框

data.frame（变量名=数据,变量名=数据）

with（数据集,新变量）

在原数据框中添加新变量

transform（数据集,新变量1,新变量2）

一次性添加多个新定义变量

subset（data,条件）

提取满足条件的子集

列表

list（x,y,z）

不同类型的数据x,y,z…组成的对象

时间序列

ts（data=NA,start=1,end=numeric（0）,frequency=1,deltat=1,ts.eps=getOption（“ts.eps”）,class,names）

三、数据的浏览与编辑

命令

解释

head（数据集）

显示数据集的前6个观测值

tail（数据集）

显示数据集的后6个观测值

names（数据集）

显示数据集中的变量

data.entry（数据集）

通过数据编辑器打开数据集（可编辑）

edit（数据集）

通过数据编辑器编辑数据集

fix（数据集）

通过数据编辑器编辑数据集

attach（数据集）

激活或挂接数据集，使之成为当前数据集

detach（数据集）

卸载或挂起当前数据集

ls（）

显示所有在内存中的对象,选项pat=“字符”只显示名称带指定字符的对象

ls.str（）

显示内存中所有对象的详细信息,选项max.level=-1规定详细级别

rm（对象）

删除内存中的对象

四、数据的运算

+加法

<小于

！

x逻辑非

-减法

>大于

x&y逻辑与

*乘法（逐元乘积）

<=小于或等于

x&&y逻辑与（只作用第一个元素）

/除法

>=大于或等于

x|y逻辑或

^乘方

==等于

x||y逻辑或（只作用第一个元素）

%%模

=不等于

xor（x,y）异或

%/%整除

t（矩阵）矩阵转置

det（A）方阵的行列式

%*%矩阵的代数积

rbind（A,B）按行合并矩阵

cbind（A,B）按列合并矩阵

apply（X,MARGIN=,FUN=）对X按MARGIN采取FUN运算,MARGIN=1按列,=2按行

sweep（X,MARGIN,STATS,FUN）对X按MARGIN采取FUN计算STATS,并从X中除去

五、数据的存储与读取

命令

解释

write.table（数据,file=“存储路径”）

保存为文本文件.txt,选项row.names=F行名不写入文件,quote=F变量名不放双引号中

write.csv（数据,file=“存储路径”）

保存为用逗号分割的文本文件.csv

save（数据,file=“存储路径”）

保存为R格式文件.Rdata

save.image（）

保存工作空间的映像

read.table（“文件地址”）

读取表格形式数据,选项header=TRUE将第一行作为表头行

read.csv（）或read.csv2（）

读取用逗号分割的数据

read.delim（）或read.delim2（）

读取用其他分割符分割的数据

scan（“文件名”,what=list（变量名=变量类型））

what=为名义列表,可直接命名对象

read.fwf（“文件地址”,widths=向量,col.names=向量）

读取文件中固定宽度格式的数据

Excel数据读取：

先Ctrl+C复制内容,再用命令read.delim（“clipboard”）

Excel数据读取：

library（RODBC）再z<-odbcConnectExcel（“Excel文件地址”）再sqlFetch（z,“Sheet1”）,close（z）

data（）

列出R的全部数据集

data（数据集,package=“程序包”）

载入指定程序包中指定数据集

load（“R文件地址”）

重新加载R数据

六、程序命令

if（条件）表达式1else表达式2

ifelse（条件，满足执行语句,否则执行）

for（变量in向量）表达式

while（条件）表达式

repeat表达式if（条件）break

函数名=function（参数列表）{函数体}

七、绘图函数

命令

解释

plot（x）

以序号为横坐标,以x的元素值为纵坐标绘图

plot（x,y）

以x为横y为纵坐标绘图

sunflowerplot（x,y）

以x为横y为纵坐标绘图,相似坐标的点为花朵，花瓣数目为点的个数

pie（x）

饼图

boxplot（x）

箱形图

stripchart（x）

将x的值画在一条线段上

coplot（x~y|z）

关于z的每个值绘x与y的二元图

interaction.plot（f1,f2,y）

以f1为x轴,f2的不同值对应不同曲线,作y的均值图,选项fun=函数,指定y的其他统计量

matplot（x,y）

x与y的相应列匹配作二元图,各图在同一作图区域上

dotchart（x）

若x是数据框,作Cleveland点图（逐行逐列累加图）

fourfoldplot（x）

用四个四分之一圆显示2×2列联表情况

assocplot（x）

Cohen-Friendly图,显示在二维列联表中行、列变量偏离独立性的程度

mosaicplot（x）

列联表的对数线性回归残差的马赛克图

pairs（x）

如果x是矩阵或数据框,作x的各列之间的二元图

plot.ts（x）

作x的时间序列曲线,x多元时须有相同的频率和时间

ts.plot（x）

作x的时间序列曲线,x多元时须有相同的频率

hist（x,probability=T）

x的频率直方图

barplot（x）

x的条形图

qqnorm（x）

正态分位数-分位数图

qqplot（x,y）

y对x的分位数-分位数图

contour（x,y,z）

等高线图,x、y须为向量,z为矩阵dim（z）=c（length（x）,length（y））

filled.contour（x,y,z）

等高线之间的区域是彩色的

image（x,y,z）

同上,实际数据大小用不同色彩表示

persp（x,y,z）

同上,但为透视图

stars（x）

若x是矩阵或数据框，星形和线段画出

symbols（x,y,…）

在由x和y给定坐标画符号

termplot（mod.obj）

回归模型（mod.obj）的（偏）影响图

points（x,y）

添加点

lines（x,y）

添加线

text（x,y,labels,）

在（x,y）处添加labels指定的文字

mtext（text,side=3,line=0,…）

在边空添加用text指定的文字,side指定添加在哪边,line指定添加文字距绘图区域的行数

segments（x0,y0,x1,y1）

从（x0,y0）到（x1,y1）画线段

arrows（x0,y0,x1,y1,angle=30,code=2）

同上,code=1,箭头从（x0,y0）到（x1,y1）,code=2,（x1,y1）到（x0,y0）,code=3,两端都有.

abline（a,b）

斜率为b截距为a的直线

abline（h=y）

水平线

abline（v=x）

垂直线

abline（lm.obj）

由lm.obj确定的回归线

rect（x1,y1,x2,y2）

绘长方形

polygon（x,y）

绘多边形

legend（x,y,legend=“”）

在（x,y）处添加图例

title（）

添加标题

axis（side,…）

画坐标轴,side=1画在下边,side=2左边,side=3上边,side=4右边

box（）

当前图上加边框

rug（x）

在x轴上用短线标出x数据的位置

locator（n,type=“n”,…）

鼠标点击n次后返回n个位置的坐标,并按type划点或线

text（x,y,expression（表达式））

在图上加数学表达式

text（x,y,as.expression（substitute（表达式，参数值）））

在表达式中代入某个变量值

curve（x）

画曲线

persp（x）

三维透视图

八、绘图参数

命令

解释

add=FALSE

TRUE时表叠加图形到前一个图上

axes=TRUE

FALSE时不绘制轴与边框

type=“p”

指定图形的类型.p:

点,l:

线,b:

点连线,o:

点连线,线在点上,h:

垂直线,s:

阶梯式,垂直线顶端显示数据,S:

垂直线底端显示数据

xlim=,ylim=

指定轴的上下限

xlab=,ylab=

坐标轴的标签，字符型值

main=

主标题，字符型值

sub=

副标题

adj=

控制文字对齐方式.0:

左对齐,0.5:

居中,1:

右对齐

bg=“”

指定背景色

bty=“”

控制图形边框形状.“o”,“l”,“7”,“”c,“u”,“]”

cex

控制符号和文字大小.拓展:

cex.axis,cex.lab,cex.main,cex.sub

col

控制符号颜色

font

控制文字字体.1:

正常,2:

斜体,3:

粗体,4:

粗斜体

las

控制坐标轴刻度数字标记方向.0:

平行于轴,1:

横排,2:

垂直于轴,3:

竖排

lty

控制连线线型.1:

实线,2:

虚线,3:

点线,4:

点虚线,5:

长虚线,6:

双虚线,

lwd

控制连线宽度的数字

mar

控制图形边空.c（bottom,left,top,right）四个值

mfcol=c（nr,nc）

c（nr,nc）向量分割窗口,按列使用子窗口

mfrow=c（nr,nc）

c（nr,nc）向量分割窗口,按行使用子窗口

pch=1:

控制符号类型.1:

25种样式

控制文字大小的整数

pty

指定绘图区域类型的字符.“s”正方形,“m”最大利用

tck

指定轴上刻度长度值（百分比）,以图形宽、高中最小一个作基数

tcl

同上,但以文本行高度为基数

xaxt=

“n”设置x轴但不显示

yaxt=

“n”设置y轴但不显示

par（）

后续图形按par中设定参数绘制

九、常用概率分布命令

分布密度

R命令（d,p,q,r）

参数

Beta

_beta

shape1,shape2

Binomial

_binom

size,prob

Cauchy

_cauchy

location=0,scale=1

Chi-sqaured

_chisq

df,ncp

Dirichlet

_dirichlet

alpha

Exponential

_exp

rate

Fisher-Snedecor

df1,df2,ncp

Gamma

_gamma

shape,scale=1

Geometric

_geom

prob

GeneralizedExtremeValue

_gev

xi,mu,sigma

GeneralizedPareto

_gpd

xi=1,mu=0,sigma=1

Hypergeometric

_hyper

m,n,k

InverseGamma

_invgamma

shape,rate

InverseWishart

_iwish

v,S

Logistic

_logis

location=0,scale=1

Lognormal

_lnorm

meanlog=0,sdlog=1

Multinomial

_multinom

size,prob

MultivariateNormal

_mvnorm

mean,sigma

Multivariate-t

_mvt

sigma=diag

（2）,df=1

Negativebinomial

_nbinom

size,prob

Normal

_norm

mean=0,sd=1

Poisson

_pois

lambda

Student’s

Uniform

_unif

min=0,max=1

Weibull

_weibull

shape,scale=1

Wilcoxon’sstatistics

_wilcox

_signrank

m,n

Wishart

_wish

v,S

一十、基本统计分析函数

命令

解释

max（x）

返回向量x中最大元

min（x）

返回向量x中最小元

which.max（x）

返回x最大元的下标

which.min（x）

返回x最小元的下标

mean（x）

计算样本x的均值

median（x）

计算样本x的中位数

mad（x）

计算中位绝对离差1.4826median（abs（x-median（x）））

var（x）

计算样本x的方差

sd（x）

计算样本x的标准差

range（x）

返回向量c（min（x）,max（x））

IQR（x）

计算样本x的四分位数极差

quantile（x）

计算样本x的常用分位数

summary（x）

计算样本x的常用描述性统计量（五数概括）

length（x）

返回向量x的长度

mode（x）

返回对象x的类型

sum（x）

给出向量x的总和

prod（x）

给出向量x的乘积

rev（x）

取向量x的逆序

sort（x）

按升序排序,选项decreasing=TRUE表降序

order（x）

返回x的秩（升序）,选项decreasing=TRUE表降序

rank（x）

返回x的秩

cumsum（x）

返回向量x的累积和

cumprod（x）

返回向量x的累积积

cumin（x）

返回向量x的累积最小值

cummax（x）

返回向量x的累积最大值

var（x,y）

计算样本x,y的协方差

cov（x,y）

计算样本x,y的协方差

cor（x,y）

计算样本x,y的相关系数

outer（x,y）

计算样本x,y的外积

sample（x,n）

从样本x中抽取n个个体,选项replace=TRUE表有放回抽样,prob=y表x中元素出现的概率

choose（n,k）

从n中抽k个组合

density（x,bw=,kernel=“”）

x的核密度估计,bw为窗宽,kernel为选择光滑化函数

kde2d（x,y）

MASS程序包中二维核密度估计

hist（x,breaks=“”,freq=T）

x的频数直方图

stem（x）

茎叶图

skewness（x）

样本的偏度系数（需加载fBasics程序包）

kurtosis（x）

样本的峰度系数（需加载fBasics程序包）

basicStats（x）

fBasics包中的命令,计算常用的统计特征量

lowess（）或loesss（）

用一条非线性曲线拟合散点图

aggregate（数据框,分组变量,函数）

对数据框的指定分组变量按指定函数统计分析

optimize（f=,interval=,maximum=TRUE,…）

单参数的极大似然估计（求单变量极值）

optim（par,fn,gr=NULL,method=c（“Nelder-Mead”,“BFGS”,“CG”,“L-BFGS-B”,“SANN”）,…）

按选用的method求多元函数极值（多维极大似然估计）

nlm（f,p,hessian=FALSE,typsize=rep（1,length（p））,fscale=1,…）

使用牛顿-拉夫逊算法求函数的最小值点

t.test（x,y,alternative=c（“two.sided”,“less”,“greater”）,mu=0,paired=FALSE,var.equal=FALSE,conf.level=0.95,…）

方差未知时均值的区间估计与假设检验

var.test（x,y,ratio=1,alternative=c（“two.sided”,“less”,“greater”）,conf.level=0.95,…）

两正态总体方差比的区间估计与假设检验

prior.norm（mean=,cov=,trendsd=0）

evdbayes包中产生三参数（位置、尺度、形状）服从三维正态的先验分布

prior.prob（quant,alpha,trendsd=0）

evdbayes包中产生Beta分布参数的先验分布

prior.quant（prob=10^-（1:

3）,shape,scale,trendsd=0）

evdbayes包中产生Gamma分布参数的先验分布

posterior（n,init,prior,lh=c（"none","gev","gpd","pp","os"）,...,psd,

burn=0,thin=1）

evdbayes包中产生参数的后验分布,n迭代次数,init为初始迭代值,prior为先验分布,lh为极大似然函数适用分布,有gev,gpd,pp,os,none,psd为建议分布标准差,

hill（data,option=c（"alpha","xi","quantile"）,start=15,end=NA,reverse=FALSE,p=NA,ci=0.95,auto.scale=TRUE,labels=TRUE,...）

evir包中hill估计

gpd（data,threshold=NA,nextremes=NA,method=c（"ml","pwm"）,information=c（"observed","expected"）,...）

evir包中GPD分布估计,threshold=阈值,nextremes=k（第k大次序量位置）,两者选一.method=c（"ml","pwm"）中ml表极大似然方法,pwm表概率权矩方法,

plot.gpd（gpd（data,threshold=））或plot（gpd（data,threshold=））

（evir包）四选项：

选1画超出量分布,2画底分布的尾,3残差图4残差的QQ图0退出

tailplot（x,optlog=NA,extend=1.5,labels=TRUE,...）

evir包中画底分布的尾,x为gpd产生数据,optlog=“x”x轴取对数,“y”y轴取对数,“xy”xy都取对数,

quant（data,p=0.99,models=30,start=15,end=500,reverse=TRUE,ci=0.95,auto.scale=TRUE,labels=TRUE,...）

evir包中GPD高分位数估计图

shape（data,models=30,start

展开阅读全文