ImageVerifierCode 换一换
格式:DOCX , 页数:33 ,大小:148.20KB ,
资源ID:12288532      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/12288532.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(R语言编程指南和使用手册.docx)为本站会员(b****4)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

R语言编程指南和使用手册.docx

1、R语言编程指南和使用手册R-语言编程指南和使用手册在R的官方教程里是这么给R下注解的:一个数据分析和图形显示的程序设计环境(A system fordata analysis and visualization which is built based on S language.)。R的源起R是S语言的一种实现。S语言是由 AT&T贝尔实验室开发的一种用来进行数据探索、统计分析、作图的解释型语言。最初S语言的实现版本主要是S-PLUS。S-PLUS是一个商业 软件,它基于S语言,并由MathSoft公司的统计科学部进一步完善。后来Auckland大学的Robert Gentleman 和 R

2、oss Ihaka 及其他志愿人员开发了一个R系统。R的使用与S-PLUS有很多类似之处,两个软件有一定的兼容性。R is freeR是用于统计分析、绘图的语言和操作环境。R是属于GNU系统的一个自由、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具。R是一套完整的数据处理、计算和制图软件系统。其功能包括:数据存储和处理系统;数组运算工具(其向量、矩阵运算方面功能尤其强大);完整连贯的统计分析工具;优秀的统计制图功能;简便而强大的编程语言:可操纵数据的输入和输入,可实现分支、循环,用户可自定义功能。R是一个免费的自由软件,它有UNIX、LINUX、MacOS和WINDOWS版本

3、,都是可以免费下载和使用的,在那儿可以下载到R的安装程序、各种外挂程序和文档。在R的安装程序中只包含了8个基础模块,其他外在模块可以通过CRAN获得。R的特点(1) 有效的数据处理和保存机制。(2) 拥有一整套数组和矩阵的操作运算符。(3) 一系列连贯而又完整的数据分析中间工具。(4) 图形统计可以对数据直接进行分析和显示,可用于多种图形设备。(5) 一种相当完善、简洁和高效的程序设计语言。它包括条件语句、循环语句、用户自定义的递归函数以及输入输出接口。(6) R语言是彻底面向对象的统计编程语言。(7) R语言和其它编程语言、数据库之间有很好的接口。(8) R语言是自由软件,可以放心大胆地使用

4、,但其功能却不比任何其它同类软件差。(9) R语言具有丰富的网上资源一 入门训练1. 获取帮助 help.start() 开启帮助文档 help(solve) 显示某命令的帮助信息,或者 ?solve 对于由特殊字符指定的功能,这些参数必须用单引号或双引号括起来,使之成为一个“字符串”,如 help() 与某个主题相关的例子通常可以用下面的命令得到 example(topic)2. 命令简介 R对大小写是敏感的;名称不能以数字开始; 基本的命令由表达式或者赋值语句组成。如果一个表达式被作为一条命令给出,它将被求值、打印而表达式的值并不被保存。一个赋值语句同样对表达式求值之后把表达式的值传给一个

5、变量,不过并不会自动的被打印出来; 命令由分号(;)来分隔,或者另起新行; 基本命令可以由花括号(f和g)合并为一组复合表达式; 注释几乎可以被放在任何地方,只要是以井号( # )开始,到行末结束; 如果一个命令在行莫仍没有结束,R将会给出一个不同的提示符,默认的是+。3. 命令文件的执行和输出转向到文件如果命令存储于一个外部文件中,比如工作目录work中的commands.R,他们可以随时在R的任务中被执行source(commands.R)在Windows中Source也可以由File菜单执行。函数sink,sink(record.lis)将把所有后续的输出由终端转向一个外部文件,reco

6、rd.lis。命令 sink() 将把信息重新恢复到终端上。4. 数据的保持与对象的清除R所创建、操作的实体是对象。对象可以是变量、数组、字符串、函数以及由这些元素组成的其它结构;objects() 用来显示目前存储在R中的对象的名字。而当前存储的所有对象的组合被称为workspace;清除对象可以使用rm命令:rm(x, y, z, ink, junk, temp, foo, bar)所有在一个R任务中被创建的对象都可以在文件中被永久保存,并在其它的R任务中被使用。在每个R任务结束时用户都有机会保存当前有效的所有对象。如果用户这样做的话,对象将被写入当前目录一个名为.RData。当R被再次启

7、动时R会从这个文件中再载入workspace。同时相关的命令记录也被载入。所以,推荐大家在用R进行不同的分析时分别使用不同的工作目录。5. 基本数据结构数值型(numeric)1,1.2,3.1415926复数型(complex)1+2i字符型(character)A/ “hello world!”逻辑型(logical)TRUE / FALSE6. 基本数据对象向量(vector), 见下节矩阵(matrix):更一般的说数组是向量在多维情况下的一般形式。事实上它们是可以被两个或更多的指标索引的向量,并且以特定的方式被打印出来。因子(factors)提供了一种处理分类数据的更简介的方式。列表

8、(list): 是向量的一种一般形式,并不需要保证其中的元素都是相同的类型,而且其中的元素经常是向量和列表本身。数据框(data frame):是一种与矩阵相似的结构,其中的列可以是不同的数据类型。可以把数据框看作一种数据矩阵,它的每行是一个观测单位,而且(可能)同时包含数值型和分类的变量。函数( function):能够在R的workspace中存储的对象。我们可以通过函数来扩展R的功能。二 简单操作,数值与向量2.1 向量与赋值R对命名了的数据结构进行操作。最简单的数据结构是数字向量;如, x - c(10.4, 5.6, 3.1, 6.4, 21.7) c()是创建函数,赋值运算符是as

9、sign(x, c(10.4, 5.6, 3.1, 6.4, 21.7) 也可以写成:c(10.4, 5.6, 3.1, 6.4, 21.7) - x如果一个表达式被当作一个完整的命令,它的值将被打印到终端但不被储存。单独输入x则会将值打印出来。也可以打印倒数: 1/x y v s5 temp 13逻辑操作符包括, , =,完全相等=和不等于!=,与或非分别为&, |, !。在普通运算中,FALSE当做0而TRUE当做1。2.5 缺失值NA(not available):一般来讲一个NA的任何操作都将返回NA。 is.na(x)返回一个与x等长的逻辑向量,并且由相应位置的元素是否是NA来决定这

10、个逻辑向量相应位置的元素是TRUE还是FALSE。 x=NA是一个与x具有相同长度而其所有元素都是NA的向量。NaN(Not a Number):由数值运算产生,如0/0, Inf-Inf. is.na(x)对于NA和NaN值都返回TRUE, is.nan(x)只对NaN值返回TRUE。2.6 字符向量字符串在输入时可以使用单引号()或双以号(); 在打印时用双引号(有时不用引号)。R使用与C语言风格基本相同的转义符,所以输入打印的也是, 输入 打印引号, n: 换行, t: tab, b: 回格。字符向量可以通过函数c()连接;paste()可以接受任意个参数,并从它们中逐个取出字符并连成字

11、符串,形成的字符串的个数与参数中最长字符串的长度相同。如果参数中包含数字的话,数字将被强制转化为字符串。在默认情况下,参数中的各字符串是被一个空格分隔的,不过通过参数sep=string 用户可以把它更改为其他字符串,包括空字符串。例如: labs y (x+1)(!is.na(x) & x0 - z 表示创建一个对象z,其中的元素由向量x+1中与x中的非缺失值和正数对应的向量组成。2. 正整数的向量 x6 是x的第六个元素 x1:10 选取了x的前10个元素(假设x的长度不小于10)。 c(x,y)rep(c(1,2,2,1), times=4) 产生了一个字符向量,长度为16,由x, y,

12、 y, x重复4次而组成。3. 负整数的向量 y fruit names(fruit) lunch xis.na(x) yy 0 - -yy y - abs(y)三 对象,模式和属性3.1 固有属性:模式和长度对象是R所进行操作的实体,对象可以是向量、列表等,详见1.6.对象的模式包括numeri,ccomplex,character,logical,list,function,expression等。可以用mode(object)查看。对象的长度是对象的另一固有属性。可以用length(object)查看。attribute(object)可以查看更深入的属性。模式的转换在允许的情况下(大多

13、数情况都是允许的),R可以完成各种模式的转换。例如:d-as.character(z),将数值向量z e e3 alpha attr(z,dim) - c(10,10) 另R将z作为一个10X10的矩阵看待。3.4 对象的类别对象的一个特别属性,类别,被用来指定对象在R编程中的风格。比如:如果对象类别data.frame则会以特定方式处理。unclass()可以去除对象的类别。summary()可以查看对象的基本信息(min, max, mean, etc.)四 有序因子和无序因子因子是一种向量对象,它给自己的组件指定了一个离散的分类(分组),它的组件由其他等长的向量组成。R提供了有序因子和无

14、序因子。通俗点说,因子就是将对象的值分成不同的组(levels)。用函数factor()创建一个因子,levels按序排列(字母序或数值序)。例如provincepf pf 打印出来1 四川 湖南 江苏 四川 四川 四川 湖南 江苏 湖南 江苏Levels: 湖南 江苏 四川函数levels()可以用来观察因子中有多少不同的levels。假如我们拥有这些省份考生的分数: score smeans smeans 湖南 江苏 四川85.66667 91.00000 87.50000再例如,下面命令会给出各组的length tapply(score,pf,length)湖南 江苏 四川 3 3 4函

15、数ordered()可以创建有序因子 ordered(province)1 四川 湖南 江苏 四川 四川 四川 湖南 江苏 湖南 江苏Levels: 湖南 江苏 dim(z) array(1:20, dim=c(4,5) matrix(1:24, 3,4)数据向量中的值被赋给数组中的值时,将遵循与FORTRAN相同的原则主列顺序,即第一个下标变化的最快,最后的下标变化最慢。数组的运算数组可以在算数表达式中使用,结果也是一个数组,这个数组由数据向量逐个元素的运算后组成,通常参与运算的对象应当具有相同的dim属性。5.2 数组的索引和数组的子块数组中的单个元素可以通过下标来指定,下标由逗号分隔,写

16、在括号内。我们可以通过在下标的位置给出一个索引向量来指定一个数组的子块,不过如果在任何一个索引位置上给出空的索引向量,则相当于选取了这个下标的全部范围。如a2,,a,3,等5.3 索引数组除了索引向量,还可以使用索引数组来指定数组的某些元素。例如:有4X5的数组a,若要得到a中的a1,3, a2,2 和a3,1这三个元素,可以生成索引向量i,然后用ai得到它们。a i i,1 ,21, 1 32, 2 23, 3 1 ai1 9 6 3 ai ab ab -outer(a, b, *)其中的乘法操作可以由任意一个双变量的函数替代。广义转置:函数t(A),或aperm(A, c(2,1);获取行

17、数/列数:nrow(A)和ncol(A)分别返回矩阵A的行数和列数。矩阵乘法:操作符为%*%;交叉乘积(cross product):crossprod(X,Y)等同于t(X) %*% y,crossprod(X)等价于crossprod(X, X);diag(v):如果v是向量,diag(v)返回一个由v的元素为对角元素的对角矩阵。 如果v为矩阵,diag(v)返回一个由v主对角元素组成的向量。 如果v只是一个数值,那么diag(v)是一个vXv的单位矩阵。特征值和特征向量:eigen(Sm)。这个函数的结果是由名为values和vectors的两部分组成的列表。如果只是需要特征值:eige

18、n(Sm)$values最小二乘拟合即QR分解:lsfit(), qr()。强制转换为向量:as.vector(),或者直接c().解线性方程和求矩阵的逆,奇异值分解与行列式见;六 列表和数据帧6.1 列表列表是由称作组件的有序对象集合构成的对象。组件的模式或类型不一定相同。形如Lst Lst -list(name=Fred, wife=Mary, no.children=3,child.ages=c(4,7,9)所使用的组件是被复制到新的列表中的,对原始对象没有影响。组件总是被编号的,并且可以通过编号指定。Lst1即为Fred,也可以用Lst$name,Lstname指定。如果Lst4是一个有下标的数组,Lst41就是它的第一项。区分Lst1和Lst1,.是选择单个元素时使用的操

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1