-
数据框:
存储表格数据。视为各种元素长度相同的列表,每个元素代表一列数据,每个元素的长度代表行数,元素类型可以不同。相当于表格
创建数据框:数据框名字 <- data.frame(第一列内容id=c(1,2,3,4),第二列内容name=c(1,2,3,4),...,第n列内容) #列名和列的值
查看数据框行数:nrow(数据框名字)
查看数据框列数:ncol(数据框名字)
将数据框转换成矩阵:矩阵名字 <- data.matrix(数据框名字)
查看全部 -
缺失值:
NA和NaN NaN一般表示数字的缺失值,NA可以表示的缺失值类型更广,所以NaN属于NA,NA不属于NaN。
NA有类型属性:integer NA,character NA等
判断向量中是否有缺失值:is.na(向量名),is.nan(向量名),如果是缺失值返回TRUE,如果不是返回FALSE
查看全部 -
2.5 factor(因子)
--分类数据/有序 vs 无序
--整数向量+标签(label)
创建因子
x<-factor(c("female","female","male","male","female"))
y<-factor(c("female","female","male","male","female"),levels =c("male","female")) levels代表基线水品
table(x)
unclass(x) 去掉属性看内容
class(unclass(x)) 整型
因子factor:可以理解为整数向量+标签(label)(优于整数向量,每个数字有自己具体的含义)。
查看全部 -
列表(list): 1.列表与向量的差别:列表可以同时包含不同类型的对象 2. l <- list("a", 2, 10L, 3+4i, TRUE)#建立列表 l2 <- list(a=1 ,b=2 ,c=3)#为列表元素命名 l3 <- list(c(1,2,3),c(4,5,6,7))#列表元素可以是向量,创建元素个数大于1 x <- matrix(1:6, nrow=2, ncol=3) dimnames(x) <- list(c("a","b"),c("c","d","e"))#为矩阵维度(行、列)命名
查看全部 -
矩阵:向量+维度属性(整数向量:nrow,ncol),维度只能为2 创建矩阵: ①矩阵名 <- matrix(nrow=行数,ncol=列数) #或者在前面添加矩阵的内容,是列优先形式填充的。 ②创建一个向量,通过dim(向量名) <- c(行数,列数)变为矩阵 查看矩阵列数和行数:dim(矩阵名字) 查看矩阵属性:attributes(矩阵名字) 矩阵拼接: ①行拼接:rbind(矩阵1名字,矩阵2名字) ②列拼接:cbind(矩阵1名字,矩阵2名字) 数组:与矩阵类似,但是维度可以大于2 创建数组:数组名 <- array(数组内容,维度设定dim = c())
查看全部 -
cbind()为按照列来拼接 rbind()是按照行来拼接
查看全部 -
除了使用matrix直接创建矩阵,还可以通过先创建一个向量,再赋予维度的方法。比如,先创建一个向量y,在用dim(y)<-c(2,3)赋予维度,2行,3列。
查看全部 -
矩阵小结:
--向量+维度属性(整数向量:nrow,ncol)
创建空白矩阵 x<-matrix(nrow=行数,ncol=列数)
创建矩阵 x<-matrix(内容,nrow=行数,ncol=列数) 矩阵填充,是从上到下先填充第一列,填完,再填充第二列
查看矩阵行列数 dim(x)
查看矩阵有哪些属性 attributes(x)
查看全部 -
小结向量:
查看全部 -
names()可以给向量的元素添加名称
查看全部 -
强制类型转换:
as.numeric()
as.logical()
as.character()
强制转换可能会引入缺失值,比如"a"强转numeric类型会变为NA
查看全部 -
注释:# ,跟python一样
向量(vector)的表示方法:
x<- vector("characrer",length=10) #长度为10的字符向量,元素为空
x1<-1:4 # x=(1,2,3,4)
x2<-c(1,2,3,4)
如果用第三种方法去创建 向量时,传入三种不同类型的值,R会自动强制转换成可用类型
控制台的命令是一次的,如果想重复使用,就要新建文件,而且文件里的执行需要选择语句才可以执行,不像命令里的语句,直接按回车键。
查看全部 -
R对象的属性:
。名称 (name) 。维度 (dimension:matrix array) 。类型 (class) 。长度 (length)
查看全部 -
用class()函数查看变量的类型
赋值类型有两种:<-还有=(有写情况会报错),标准的是用<- ,如果强调整数则在数字后加L
逻辑型中的布尔类型True/False需要大写,R是区分大小写的语言
字符型的参数要用""
查看全部 -
R中对象的5种基本类型:字符、数值、整数、负数、逻辑
其中数值是包括小数的。
查看全部
举报