-
填充矩阵时是按照列来填充的查看全部
-
因子
分类数据/有序 vs.无序
整数向量+标签(label)(优于整数向量)
常用于lm(),glm()
创建因子
factor()
table()/unclass()
查看全部 -
列表 list
可以包含不同类型的对象
创建列表 list()
dimnames(x) <- list()
查看全部 -
1、矩阵
向量+纬度属性(整数向量:nrow,ncol)
创建矩阵
matrix()先列后行
vector()+dim()
cbind(),rbind()
attributes()
2、数组
与矩阵类似,但是纬度可以大于2
创建数组 array()
查看全部 -
向量
只能包含同一类型的对象
创建向量
vector()
c()
as.logical()/as.numeric()/as.character()
查看全部 -
对象的属性:名称、纬度、类型、长度
查看全部 -
对象的5种基本类型
字符、数值、整数、复数、逻辑
查看全部 -
清晰,简练查看全部
-
#rnorm(100) 随机从正态分布的总体里抽取100个数
x <- matrix(rnorm(100), 10, 10)
#quantile函数求百分位点的值,probs参数设置具体求哪些百分位点
#apply的第2个参数,1表示行,2表示列
apply(x, 1, quantile, probs = c(0.25, 0.75))
查看全部 -
rnorm(2*3*4)是什么意思?
查看全部 -
> strptime(x1,"%B %d, %Y %H:%M")
[1] NA
为什么得到的是缺失值?
查看全部 -
NaN属于NA,NaN一般指数字的缺失值
查看全部 -
描述factor可以用table函数,如
x<-factor("female","female","male","male","male")
table(x)
x female male
2 3
levels用在factor内描述其水平 如levels=c("male","female")
查看全部 -
#一句话函数
#遍历列表的函数 lapply,总是返回列表
str(lapply)
x<-list(a=1:10,b=c(11,21,31,41,51))
lapply(x,mean)
x<-1:4
lapply(x, runif)#默认从0-1抽取
lapply(x, runif,min=0,max=100)x<-list(a=matrix(1:6,2,3),b=matrix(4:7,2,2))
lapply(x,function(m) m[1,])
#sapply,结果列表元素长度都是1返回向量,
#结果列表长度相同且大于1时返回矩阵
x<-list(a=1:10,b=c(11,21,31,41,51))
sapply(x, mean)#apply
x<-matrix(1:16,4,4)
x
apply(x, 2,mean)#对第2维度进行操作
x<-matrix(rnorm(100),10,10)
x
apply(x,1,quantile,probs=c(0.25,0.75))x<-array(rnorm(2*3*4),c(2,3,4))
apply(x,c(1,3),mean)#第1维和第2维的平面沿着第3维求均值
apply(x,c(1,2),mean)
apply(x,c(2,3),mean)#mapply ,lapply的多元版本
list(rep(1,4),rep(2,3),rep(3,2),rep(4,1))
mapply(rep,1:4,4:1)s<-function(n,mean,std){rnorm(n,mean,std)}
s(4,0,1)#从均值为0,标准差为1的正态分布里抽取4个数据
mapply(s,1:5,5:1,2)
list(s(1,5,2),s(2,4,2),s(3,3,2),s(4,2,2),s(5,1,2))#tapply对向量的子集进行操作
#tapply(向量,因子/因子列表,函数/函数名)
x<-c(rnorm(5),runif(5),rnorm(5,1))
x
f<-gl(3,5)#生成因子水平,3个水平每个水平5个元素
f
#对向量X按照因子的水平进行分组,对每组求均值
tapply(x,f,mean)
tapply(x,f,mean,simplify = FALSE)#split函数
#根据因子或因子列表将向量或其他对象分组,
#通常与lapply一起使用
#aplit(向量/列表/数据框,因子/因子列表)
x<-c(rnorm(5),runif(5),rnorm(5,1))
f<-gl(3,5)#生成因子水平,3个水平每个水平5个元素
split(x,f)
lapply(split(x,f), mean)head(airquality)
s<-split(airquality,airquality$Month)
s
table(airquality$Month)
lapply(s, function(x) colMeans(x[,c('Ozone','Wind','Temp')]))
sapply(s, function(x) colMeans(x[,c('Ozone','Wind','Temp')]))
lapply(s, function(x) colMeans(x[,c('Ozone','Wind','Temp')],na.rm = TRUE))
sapply(s, function(x) colMeans(x[,c('Ozone','Wind','Temp')],na.rm=TRUE))#排序
x<-data.frame(v1=1:5,v2=c(10,7,9,6,8),v3=11:15,v4=c(1,1,2,2,1))
x
sort(x$v2)#升序
sort(x$v2,decreasing = TRUE)
order(x$v2)
x[order(x$v2),]
x[order(x$v4,x$v2),]
#总结数据信息
head(airquality)
head(airquality,10)
tail(airquality)
summary(airquality)
str(airquality)
table(airquality$Ozone)
table(airquality$Ozone,useNA = 'ifany')
table(airquality$Month,airquality$Day)
is.na(airquality$Ozone)
any(is.na(airquality$Ozone))#是否有缺失值
sum(is.na(airquality$Ozone))
all(airquality$Month<12)
tianic<-as.data.frame(Titanic)
head(tianic)
dim(tianic)
summary(tianic)
x<-xtabs(Freq~Class +Age ,data = tianic)
ftable(x)#排版扁平化object.size(airquality)
print(object.size(airquality),units = kb)
print(object.size(airquality),units = 'kb')
print(object.size(airquality),units = 'Kb')查看全部 -
列表(元素可以不同)
查看全部
举报