-
Sys.data()获取的时间格式为Data
data()获取的时间格式为字符
weekdays(data)判断日期是星期几
months(data)判断月份是几月
quarters(data)判断是这一年的第几个季度
julian(data)返回距离1970-01-01过去了多少天
查看全部 -
构建子集:[ ] / [[ ]] / $ / [[ ]] [ ] / [[ ]] [[ ]]
处理缺失值:is.na() / complete.cases()
向量化操作:向量x+y,x*y,x/y 矩阵x%*%y
查看全部 -
两个向量,选取对应位置都不是缺失值的-用complete选出一个新变量z,只有两者都不是缺失值才会返回true,然后再用x【z】 y【z】选出都不是缺失值的
library加载数据集,dataset是r里自带的数据包
head是取数据集的前六行看看数据及有哪些变量,基本情况。这个数据集有六个变量,目前只看到 6次记录,通常我们希望选取所有变量都没有缺失值的记录
用complete输出的判断 第二行的13表示第二行的第一个true是原数据集的第十三个数据
数据框与向量还是不一样,返回输出非缺失值是考虑行和列,这里我们要每行数据都完整,所以g放在行上,列都留下,所以列的位置空着,后面再加一颗括号就依旧是行列的格式,前10行,列空着。最后输出的数据框左边数字表示选出来的数据在原数据集是第几行
查看全部 -
创建一个数据框:df<-data.frame(id = c(1,2,3,4),name = c("a","b","c","d"), gender = c(TRUE,TRUE,FALSE,FALSE))
当数据框只有一个数据类型时可以转换为一个矩阵:
df2<-data.frame(id = c(1,2,3,4),score = c(80,86,90,100))
data.matrix(df2)
查看全部 -
1、创建因子:x<-factor(c("male","female","femal","male"),levels = c("male","femal"))
2、level查看因子的基础值,在统计分析的时候用处较大。
3、unclass(x),去除分类
4、table(x):查看元素的频数
查看全部 -
列表:
1、l<-list("a",2,10L,3+4i,TRUE) #列表可以包含各种类型的数据
2、l2<-list(a = 1,b= 2,c = 3)#给列表的元素命名
3、l3<-list(c(1,2,3),c(4,5,6)) #列表中每个元素的内容个数>1
4、x<-matrix(1:6,nrow = 2,ncol = 3) dimnames(x) <- list(c("a","b"),c("c","d","e"))#矩阵的维度只能用列表来引入??
5、列表和向量都可以包含不同类型的数据,但是列表中的元素可以是向量。
查看全部 -
1、matrix填充先填充列,再填充行;
2、创建矩阵有两种方式:1),y<-1:6 dim(y)<-c(2,3)
2)y2<-matrix(1:6,nrow = 2,ncol = 3);
3、attributes()查看矩阵的信息;
5、矩阵只有行和列连个维度,但是数组的维度可以大于2,所以dim参数都是为数组设计的
查看全部 -
方括号中的[]代表的 是x所赋值对象的第一个元素
查看对象类型的函数class()
numeric--代表的是一个数值型变量 可以是整数也可以是小数
要强调整形的数值在数字后面L integer
character--代表的是字符型
逻辑型 (logical)TRUE FALSE 在R语言中逻辑型必须用大写表示
复数 complex
数据结构 属性{名称 维度 类型 长度
查看全部 -
C()函数会将三个不同类型的数全都转换成character类型
如 x3 <- c(TRUE,10,"a")
x3 为 chr [1:3] "TRUE" "10" "a"
查看全部 -
//了解数据有多大
object.size(数据)
print(object.size(数据),units="Kb")
查看全部 -
交叉表
xtabs(Freq~Class+Age,data=titanic)//计算哪两个数据交叉起来的频率
ftable()//使排版变得更加扁平化
查看全部 -
smmary(数据名称)//包括最大值最小值、25%、50%、75%位点,空值个数
str()//总结数据,变量个数、记录数、变量名称
table(airquality$Ozone,useNA="ifany")//将缺失值总结出来
is.na()//求缺失值
查看全部 -
sort:对向量进行排序,返回排好的内容
order:返回排好序的内容的下标/多个排序标准
sort(x$列名字)//按升序排列
sort(x$列名字,decreasing=TRUE)//按降序排列
x[order(x$列名字1,x$列名字2),]//先排列1,再排列2
查看全部 -
split(x,f)//将x按照f因子分为组,组数由f定
lapply(split(x,f),mean)//传入分好组之后的列表,对列表进行的操作
sapply(s,function(x) colMeans(x[,c("Ozone","Wind","Temp")],na.rm=TRUE))//除去缺失值
查看全部 -
tapply:对向量的子集进行操作
rnorm(5)//正态分布
rnorm(5,1)//均值为1标准差为0的正态分布
runif(5)//均匀分布
tapply(x,f,mean)//对向量x按照F因子的水平进行分组,对每一组求均值
查看全部
举报