为了账号安全,请及时绑定邮箱和手机立即绑定

R语言基础

  • Sys.data()获取的时间格式为Data

    data()获取的时间格式为字符

    weekdays(data)判断日期是星期几

    months(data)判断月份是几月

    quarters(data)判断是这一年的第几个季度

    julian(data)返回距离1970-01-01过去了多少天

    查看全部
  • 构建子集:[ ] / [[ ]] / $ / [[ ]] [ ] / [[ ]] [[ ]] 

    处理缺失值:is.na() / complete.cases()

    向量化操作:向量x+y,x*y,x/y    矩阵x%*%y


    查看全部
    0 采集 收起 来源:小结

    2019-03-07

  • 两个向量,选取对应位置都不是缺失值的-用complete选出一个新变量z,只有两者都不是缺失值才会返回true,然后再用x【z】 y【z】选出都不是缺失值的

    library加载数据集,dataset是r里自带的数据包

    head是取数据集的前六行看看数据及有哪些变量,基本情况。这个数据集有六个变量,目前只看到 6次记录,通常我们希望选取所有变量都没有缺失值的记录

    用complete输出的判断 第二行的13表示第二行的第一个true是原数据集的第十三个数据

    数据框与向量还是不一样,返回输出非缺失值是考虑行和列,这里我们要每行数据都完整,所以g放在行上,列都留下,所以列的位置空着,后面再加一颗括号就依旧是行列的格式,前10行,列空着。最后输出的数据框左边数字表示选出来的数据在原数据集是第几行

    查看全部
    0 采集 收起 来源:处理缺失值

    2019-03-06

  • 创建一个数据框:df<-data.frame(id = c(1,2,3,4),name = c("a","b","c","d"), gender = c(TRUE,TRUE,FALSE,FALSE))

    当数据框只有一个数据类型时可以转换为一个矩阵:

    df2<-data.frame(id = c(1,2,3,4),score = c(80,86,90,100))

    data.matrix(df2)


    查看全部
  • 1、创建因子:x<-factor(c("male","female","femal","male"),levels = c("male","femal"))

    2、level查看因子的基础值,在统计分析的时候用处较大。

    3、unclass(x),去除分类

    4、table(x):查看元素的频数


    查看全部
  • 列表:

    1、l<-list("a",2,10L,3+4i,TRUE) #列表可以包含各种类型的数据

    2、l2<-list(a = 1,b= 2,c = 3)#给列表的元素命名

    3、l3<-list(c(1,2,3),c(4,5,6)) #列表中每个元素的内容个数>1

    4、x<-matrix(1:6,nrow = 2,ncol = 3) dimnames(x) <- list(c("a","b"),c("c","d","e"))#矩阵的维度只能用列表来引入??

    5、列表和向量都可以包含不同类型的数据,但是列表中的元素可以是向量。


    查看全部
  • 1、matrix填充先填充列,再填充行;

    2、创建矩阵有两种方式:1),y<-1:6 dim(y)<-c(2,3)  

    2)y2<-matrix(1:6,nrow = 2,ncol = 3);

    3、attributes()查看矩阵的信息;

    5、矩阵只有行和列连个维度,但是数组的维度可以大于2,所以dim参数都是为数组设计的


    查看全部
  • 方括号中的[]代表的 是x所赋值对象的第一个元素

    查看对象类型的函数class() 

    numeric--代表的是一个数值型变量 可以是整数也可以是小数

    要强调整形的数值在数字后面L integer

    character--代表的是字符型

    逻辑型 (logical)TRUE FALSE 在R语言中逻辑型必须用大写表示

    复数 complex

    数据结构 属性{名称 维度 类型 长度

    查看全部
  • C()函数会将三个不同类型的数全都转换成character类型

    如 x3 <- c(TRUE,10,"a")

    x3 为 chr [1:3] "TRUE" "10" "a"

    查看全部
  • //了解数据有多大

    object.size(数据)

    print(object.size(数据),units="Kb")

    查看全部
    0 采集 收起 来源:总结数据信息

    2019-01-27

  • 交叉表

    xtabs(Freq~Class+Age,data=titanic)//计算哪两个数据交叉起来的频率

    ftable()//使排版变得更加扁平化


    查看全部
    0 采集 收起 来源:总结数据信息

    2019-01-27

  • smmary(数据名称)//包括最大值最小值、25%、50%、75%位点,空值个数

    str()//总结数据,变量个数、记录数、变量名称

    table(airquality$Ozone,useNA="ifany")//将缺失值总结出来

    is.na()//求缺失值

    查看全部
    0 采集 收起 来源:总结数据信息

    2019-01-27

  • sort:对向量进行排序,返回排好的内容

    order:返回排好序的内容的下标/多个排序标准

    sort(x$列名字)//按升序排列

    sort(x$列名字,decreasing=TRUE)//按降序排列

    x[order(x$列名字1,x$列名字2),]//先排列1,再排列2


    查看全部
  • split(x,f)//将x按照f因子分为组,组数由f定

    lapply(split(x,f),mean)//传入分好组之后的列表,对列表进行的操作

    sapply(s,function(x) colMeans(x[,c("Ozone","Wind","Temp")],na.rm=TRUE))//除去缺失值

    查看全部
    0 采集 收起 来源:R语言函数 split

    2019-01-27

  • tapply:对向量的子集进行操作

    rnorm(5)//正态分布

    rnorm(5,1)//均值为1标准差为0的正态分布

    runif(5)//均匀分布

    tapply(x,f,mean)//对向量x按照F因子的水平进行分组,对每一组求均值

    查看全部

举报

0/150
提交
取消
课程须知
本课程需要学员提前掌握 安装好R和Rstudio
老师告诉你能学到什么?
1、R语言的数据结构 2、构建数据子集 3、重要函数的使用

微信扫码,参与3人拼团

意见反馈 帮助中心 APP下载
官方微信
友情提示:

您好,此课程属于迁移课程,您已购买该课程,无需重复购买,感谢您对慕课网的支持!