为了账号安全,请及时绑定邮箱和手机立即绑定

R语言基础

  • 数据类型
    查看全部
    0 采集 收起 来源:小结

    2016-04-16

  • 构建子集
    查看全部
    0 采集 收起 来源:小结

    2016-04-16

  • 构建子集
    查看全部
    0 采集 收起 来源:基本方法

    2016-04-16

  • 数据结构
    查看全部
    0 采集 收起 来源:小结

    2016-04-16

  • 数据结构
    查看全部
    0 采集 收起 来源:小结

    2016-04-16

  • 构建子集的基本方法: 构建子集也是clean data
    查看全部
    0 采集 收起 来源:基本方法

    2016-04-12

  • 真棒的总结!
    查看全部
    0 采集 收起 来源:小结

    2016-04-12

  • 操作日期与时间
    查看全部
  • 因子: 1. 创建因子 2. 因子属性: Integer + 标签
    查看全部
  • 1. 创建向量 2. 数据类型转换
    查看全部
  • R的五种基本类型:
    查看全部
  • #总结数据信息 #默认前六行或者后六行 head(airquality, 10)#查看前10行 tail(airquality, 10)#查看后10行 summary(airquality)#总结,数据分布整体把握 str(airquality) table(airquality$Month)#对列进行频数统计 table(airquality$Ozone, useNA = "ifany")#将Ozone中NA的数值统计出来 any(is.na(airquality$Ozone))#判断是否有缺失值 sum(is.na(airquality$Ozone))#统计缺失值数量 all(airquality$Month < 12)#查看是不是所有的月份都小于12 #将Titanic强制转换为数据框 t <- as.data.frame(Titanic) t #按照Class和Age生成交叉表 x <- xtabs(Freq ~ Class + Age, data = t) x #扁平化显示 ftable(x) #查看对象大小 object.size(airquality) print(object.size(airquality),units="Kb")#按照kb显示大小
    查看全部
    0 采集 收起 来源:总结数据信息

    2018-03-22

  • #对数据进行排序 #sort返回排好序的内容 #order返回下标 x <- data.frame(v1=1:5, v2=c(10,7,9,6,8), v3=11:15, v4=c(1,1,2,2,1)) x sort(x$v2)#v2列按照升序排列 sort(x$v2,decreasing = T)#v2列按照降序排列 order(x$v2)#返回的不是内容本身,是内容的下标 x[order(x$v2),]#对x数据框按照v2进行排序 x[order(x$v4, x$v2, decreasing = T), ]#将序排列x,先按照v4,次要按照v2
    查看全部
  • #split #根据因子或者因子列表将向量或其他对象分组 #通常与lapply一起使用 #参数格式:split(向量/列表/数据框,因子/因子列表) x <- c(rnorm(5), runif(5),rnorm(5,1)) f <- gl(3,5) x f split(x,f) lapply(split(x,f), mean) lapply(split(x,f), sum) head(airquality) split(airquality,airquality$Month)#按照month分组查看 s <- split(airquality,airquality$Month) s table(airquality$Month)#查看每个Month下包含的记录数 # 求平均值 lapply(s, function(x) colMeans(x[,c("Ozone","Wind","Temp")])) #简化显示结果 sapply(s, function(x) colMeans(x[,c("Ozone","Wind","Temp")])) #处理缺失值 sapply(s, function(x) colMeans(x[,c("Ozone","Wind","Temp")],na.rm = T))
    查看全部
    2 采集 收起 来源:R语言函数 split

    2018-03-22

  • #mapply #lapply的多元版本 #lapply(函数/函数名,数据, 函数) a<-list(rep(1,4), rep(2,3), rep(3,2),rep(4,1)) a b<-mapply(rep,1:4,4:1)#等价于上面的list b s <- function(n, mean ,std){ rnorm(n, mean, std) } s(4,0,1) #调用函数s,生成1到4四个元素,其中均值是10,标准差是2 mapply(s, 1:4,10,2) list(s(4,10,1),s(3,10,1),s(2,10,1),s(4,10,1))#这个list的效果跟mapply函数一样
    查看全部

举报

0/150
提交
取消
课程须知
本课程需要学员提前掌握 安装好R和Rstudio
老师告诉你能学到什么?
1、R语言的数据结构 2、构建数据子集 3、重要函数的使用

微信扫码,参与3人拼团

意见反馈 帮助中心 APP下载
官方微信
友情提示:

您好,此课程属于迁移课程,您已购买该课程,无需重复购买,感谢您对慕课网的支持!