-
数据类型查看全部
-
构建子集查看全部
-
构建子集查看全部
-
数据结构查看全部
-
数据结构查看全部
-
构建子集的基本方法: 构建子集也是clean data查看全部
-
真棒的总结!查看全部
-
操作日期与时间查看全部
-
因子: 1. 创建因子 2. 因子属性: Integer + 标签查看全部
-
1. 创建向量 2. 数据类型转换查看全部
-
R的五种基本类型:查看全部
-
#总结数据信息 #默认前六行或者后六行 head(airquality, 10)#查看前10行 tail(airquality, 10)#查看后10行 summary(airquality)#总结,数据分布整体把握 str(airquality) table(airquality$Month)#对列进行频数统计 table(airquality$Ozone, useNA = "ifany")#将Ozone中NA的数值统计出来 any(is.na(airquality$Ozone))#判断是否有缺失值 sum(is.na(airquality$Ozone))#统计缺失值数量 all(airquality$Month < 12)#查看是不是所有的月份都小于12 #将Titanic强制转换为数据框 t <- as.data.frame(Titanic) t #按照Class和Age生成交叉表 x <- xtabs(Freq ~ Class + Age, data = t) x #扁平化显示 ftable(x) #查看对象大小 object.size(airquality) print(object.size(airquality),units="Kb")#按照kb显示大小查看全部
-
#对数据进行排序 #sort返回排好序的内容 #order返回下标 x <- data.frame(v1=1:5, v2=c(10,7,9,6,8), v3=11:15, v4=c(1,1,2,2,1)) x sort(x$v2)#v2列按照升序排列 sort(x$v2,decreasing = T)#v2列按照降序排列 order(x$v2)#返回的不是内容本身,是内容的下标 x[order(x$v2),]#对x数据框按照v2进行排序 x[order(x$v4, x$v2, decreasing = T), ]#将序排列x,先按照v4,次要按照v2查看全部
-
#split #根据因子或者因子列表将向量或其他对象分组 #通常与lapply一起使用 #参数格式:split(向量/列表/数据框,因子/因子列表) x <- c(rnorm(5), runif(5),rnorm(5,1)) f <- gl(3,5) x f split(x,f) lapply(split(x,f), mean) lapply(split(x,f), sum) head(airquality) split(airquality,airquality$Month)#按照month分组查看 s <- split(airquality,airquality$Month) s table(airquality$Month)#查看每个Month下包含的记录数 # 求平均值 lapply(s, function(x) colMeans(x[,c("Ozone","Wind","Temp")])) #简化显示结果 sapply(s, function(x) colMeans(x[,c("Ozone","Wind","Temp")])) #处理缺失值 sapply(s, function(x) colMeans(x[,c("Ozone","Wind","Temp")],na.rm = T))查看全部
-
#mapply #lapply的多元版本 #lapply(函数/函数名,数据, 函数) a<-list(rep(1,4), rep(2,3), rep(3,2),rep(4,1)) a b<-mapply(rep,1:4,4:1)#等价于上面的list b s <- function(n, mean ,std){ rnorm(n, mean, std) } s(4,0,1) #调用函数s,生成1到4四个元素,其中均值是10,标准差是2 mapply(s, 1:4,10,2) list(s(4,10,1),s(3,10,1),s(2,10,1),s(4,10,1))#这个list的效果跟mapply函数一样查看全部
举报
0/150
提交
取消