ImageVerifierCode 换一换
格式:DOCX , 页数:8 ,大小:18.20KB ,
资源ID:24444262      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/24444262.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(R语言基础知识.docx)为本站会员(b****4)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

R语言基础知识.docx

1、R语言基础知识R语言基础知识 1. R的历史R是一个有着统计分析功能及强大作图功能的软件系统,是由奥克兰大学统计学系的Ross Ihaka和Robert Gentleman 共同创立。由于他们的名字的首字母都是R,因此R便成了这门语言的名称。R受到了贝尔实验室的S语言的影响,因此R又被称之为S语言的方言。2. 寻求帮助在学习R的过程中寻求帮助的方法主要分三种谷歌一下、去论坛提问和发邮件。2.1 谷歌一下在我们使用R的时候可能会遇到的一些问题,首先我们需要将问题或者错误的提示信息粘贴到谷歌中去。目前的翻墙方法有很多,如xx-net和使用翻墙浏览器等。我登陆谷歌的方法是使用天行者浏览器来登录谷歌,

2、目前是可以正常使用的。2.2 论坛和邮件如果谷歌没法帮我们解决问题,那么我们就需要到论坛或邮件列表去咨询。在咨询的时候需要注意以下几点:提供一个可以再现错误的例子,为了达到的目的是什么,使用的R的操作系统、R的版本以及R package的版本等。3. 数据类型和数据结构3.1 基本数据类型在R语言里操作和接触的所有东西都称作对象 (object)。对象有很多种类 可以包含各种类型的数据。R 语言里所有的东西都被称为对象,R语言中常见的数据类型有几下几种,分别是字符型 (character)、数值型 (numeric)、整型 (integer)、复数型 (complex)、因子型(factor)

3、以及逻辑型 (logical)。R语言里最常见的基本对象是向量 (vector),一个向量可以包含同一类型的多个对象。数值型 (numeric):一般数字形式的数据都为数值型(实数或者小数),从传统的数据分类方式来看,即指定量变量。 x # 构造元素为1,2,3,4,5的向量x x # 输出x的值1 1 2 3 4 5 class(x) # 显示x的数据类型1 numeric整型 (integer):仅含有整数,且设定数据类型为integer,否则一般为数值型。 x1 = as.integer(x) # 将x转化为整数型数据x1 class(x1) # 显示向量x1的数据类型1 integer

4、复数型 (complex number): x2 Conj(x3)1 1+0i 2-4i其中i是个特殊符号,代表复数的虚部(imaginary part)。逻辑型 (logical):取TRUE和FALSE两个固定值,用于指示判断结果。 x = c(1,2,3,4,5) # 构造元素依次为1,2,3,4,5的向量x x1 1 2 3 4 5 x =2 # 判断向量x中等于2的元素1 FALSE TRUE FALSE FALSE FALSE !(x # 判断向量x中大于等于2的元素1 FALSE TRUE TRUE TRUE TRUE which(x # 选择向量中小于2的元素1 1 is.lo

5、gical(x) # 判断向量x是否为逻辑型数据1 FALSE字符型 (character):指向量中每个元素都是一个字符或字符串,即一般的数据分类方式中所说的定性变量。 y # 构造元素为字符串I、love、R的向量R y # 输出y的值1 Ilove R class(y) # 显示向量y的数据类型1 character length(y) # 显示向量y的维度,也就是y的元素个数1 3 nchar(y) # 显示向量y中每个元素的字符的个数1 1 4 1 y = R # 判断向量y中为R的元素1 FALSE FALSE TRUE因子型(factor):因子型数据类型简单来说就是披着定量数据

6、外壳的定性数据,即以数字代码的形式表现的字符型数据,本质上为定性数据。因子 (factor) 是一种特殊的向量类型,通常用来记录分类数据。因子有两种类型:有序的以及无序的。无序因子可以认为是用来标记那些有标签有类别但是又没有顺序的数据,比如说男性和女性。序因子可以用来标记那些有先后次序的数据,这些数据可以不是数值型的,但却是有序的。例如大学的助理教授、副教授以及正教授,这就是一种有序的分类。所以可以把有序因子当作是一个整型向量,其中每个整数都有一个标签。例如一个由1、2、3组成的向量,1代表较高的值,2代表一个中等的值,3代表一个较低的值。这三个变量将会有三个标签,分别是高、中、低,在R当中分

7、别用1、2、3来表示。可以使用factor()函数来创建因子,命令如下: sex = factor(c(1,0,1,1,0,1),levels = c(0,1),labels = c(male,female) # 设置因子型数据sex sex # 输出sex的值1 female male female female male femaleLevels: male female class(sex) # 显示sex的数据类型1 factor创建一个含有两个level(yes和no)的简单因子,命令如下: x unclass(x) # unclass() 函数能够去掉分类信息,使x变为一个整型向量

8、1 2 2 1 2 1 attr(,levels)1 no yes一个向量可以包含单一类型的多个对象,因此可以有实数向量或整数向量。但是一个标准的向量不能包含不同类型的对象,同一个向量里的所有对象都必须是同一类型的。如果一个向量中包含两种不同类型的对象,那么R会创建最低级公共类型(least common denominator)的向量。此时R不会报错,而是将向量强制转换成(coerce)为二者的最低级公共类型。例如: y1 y31 aTRUE class(y3)1 character若想强制转换对象的类型,可以使用as.numeric()、as.logical()、as.charcater(

9、)函数进行强制转换。 x as.logical(x) # 根据约定0转换成FALSE,所有大于0的数都转换成TRUE1 FALSE TRUE TRUE TRUE TRUE TRUE TRUE class(x)1 integer as.character(x)1 0 1 2 3 4 5 6 class(x)1 integer强制转换也不一定一直成功,如果它失败了就会返回NA值。所有无意义的强制转换就会导致NA值。 y plex(y)1 NA NA NAWarning message:NAs introduced by coercion x x1 1 3 5 7 93.2.2 矩阵矩阵(matri

10、x)是R里的一类特殊向量,它们不是一种单一的数据类型,而是有维度(dimension)属性的向量。维度属性是一个整型向量,它的长度为2。其中第一个数字是矩阵的行数,第二个数字是矩阵的列数。 m # matrix() 函数来创建一个2行3列的空矩阵 m ,1 ,2 ,31, NA NA NA2, NA NA NA dim(m) # 使用dim()函数返回矩阵的维度属性:在这里为2行3列1 2 3 attributes(m) # 使用attributes()函数将返回一个列表,其中的第一个元素是dim,dim中包含向量(2,3)$dim1 2 3这就是矩阵的所有特性 它是一个具有维度属性的向量。矩

11、阵是按列生成的,你可以把这个过程想象成把一个向量里的所有数按列填入矩阵中,先填第一列,填完第一列最后一行的数字后再填第二列,然后是第三列等等。例如使用1到6的数列创建一个矩阵,指定这个矩阵有2行3列,输入命令如下: n dim(m) # 使用dim()函数对数列m添加维度,把1到10的向量转变成2行5列的矩阵 m ,1 ,2 ,3 ,4 ,51, 1 3 5 7 92, 2 4 6 8 10还有一种创建矩阵的方法,通过绑定行或者列来创建。通过使用cbind()和rbind()函数来创建,命令如下: x # 构建向量x x1 1 2 3 y # 构建向量y y1 10 11 12 cbind(x

12、, y) # 使用cbind()函数以列排布的形式合并向量x和y,生成3行2列的矩阵 x y1, 1 102, 2 113, 3 12 rbind(x, y) # 使用rbind()函数以行排布的形式合并向量x和y,生成2行3列的矩阵 ,1 ,2 ,3x 1 2 3y 10 11 123.2.3 列表可以包含多种类型的对象的向量叫做列表(list),列表是一个向量是一个由多个对象组成的序列,只是其中每个对象的类型可以各不相同。比方说一个列表可以包含字符型、数值型和逻辑型的对象,也可以包含一个列表。列表的每个元素可以是不同类型的对象,这就让列表可以轻松存放各种类型的数据。在R中列表是非常有用而且

13、常用的对象,尤其是在和其它我们即将学到的函数类型一起使用时。例如使用list()函数创建一个列表 x,第一个元素是数值对象1,第二个元素是字符 “a”,第三个是逻辑值TRUE,第四个是复数。命令如下: x x11 121 a31 TRUE41 1+4i在输出结果中双层的中括号,列表的元素用里面的数字进行索引(index)。所以第一个元素是向量1,第二个元素是向量 “a”,第三个元素是向量TRUE,第四个元素是复数向量1+4i。列表元素由包围,其他向量的元素则只有,这是把列表和其他类型的向量区分开的一种方法。列表中的元素还可以是数据框(data frame)。所以组成列表的元素可以是任何类型的对象,这也是列表会这么有用的原因。数据框可以理解是一个松散的数据集。它可以是由不同类型的列( 数字、 因子、 字符等)组成的类矩阵( matrix-like)。

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1