-
如何处理缺失值
查看全部 -
矩阵中构建子集(行,列)
矩阵和向量的区别
,向量是给出行或列
矩阵给出的是行和列
查看全部 -
构建子集subsetting
raw dataset and clean dateset
【】
【【】】
$
拿到数据顺序:子集
查看全部 -
日期和时间
date,time
date()
sys.date()
as.date(年-月-日)
weekday()
months()
quarters()
julian()
posixct()
posixlT()
strptime()
查看全部 -
数据框:data frame
data.frame()
查看全部 -
因子:factor处理分类数据,有序或无序
证书向量+标签
X<-factor(c())
levels=极限水平
查看全部 -
列表:list
矩阵:matrix
数组:array
查看全部 -
is.na和is.nan的区别
查看全部 -
NaN属于NA,因为NaN一般用来表示数字的缺失值,NA可以表示的缺失值的范围更广
判断向量里面是否有缺失值,用:
is.na()/is.nan,对应以上两种缺失值
以上例子说明:
存在第二个和第四个是na类型的缺失值
不存在nan这个类型的缺失值
如果将x中的内容改成NaN则:
可以发现:na是可以检测出nan的缺失值的
查看全部 -
因子是用来处理分类数据的
有序 例子:年龄低中高
无序 例子:性别男女
因子优于整数向量,因为可以对整数向量进行描述,如你会知道1或者2代表男性还是女性
factor函数:用c将所有人的性别连在一起;输出后得到x的内容;level可以查看因子包含的水平
在factor里面插入第二个函数 levels:levels的第一个参数的就是基线水平
对x有一个基本的了解,使用table函数,可查看不同水平内容的个数:
可以用unclass函数去掉levels:
内容是:
attr显示曾经的level和其内容
用class函数查看unclass之后x变成了什么类别的数据
查看全部 -
和矩阵最大的区别就是列表可以包含不同类型的数据
list函数:每一个参数都是列表里面元素的内容
给列表里的元素命名,用元素a=名字1这样的规则进行命名
列表中每一个元素的个数大于1
用c将元素合并 c(1,2,3)的意思就是c这个元素里面有123这个三个内容
引入矩阵的维度
给矩阵的每一行每一列命名:
dimnames(矩阵)<-赋值list(行的命名,列的命名)【list里面第一个元素c包含两行,第二个元素c包含三列】
查看全部 -
创建矩阵:
matrix,两个参数,多少行+多少列
出现:
console出现:
添加矩阵的内容:
控制台console出现:
矩阵填充是按照列的方式来填充的
查看矩阵维度属性:
dim(x)
可以查看有多少行多少列
三行两列
矩阵有多少属性,有哪些属性:
attributes(x)
当前这个矩阵的属性是维度
矩阵就是向量加上维度属性
所以也可以用以下方式进行矩阵的创建:
给y向量添加维度信息dim赋值c,这个c函数里面写两个参数,第一个参数有多少行,第二个有多少列
运行后:
两个矩阵进行拼接
按照行来拼接:rbind
按照列拼接:cmind
数组
用arry函数,第一个参数是数组的内容,第二个参数是维度dim的设定
二维:
三维:
第三个维度“4”代表有四个元素;
“,,1”代表的是第三个维度里的第一个元素,也就是“4”这个维度中的第一个元素。
第三个维度的第一个元素“,,1”中是一个两行三列的矩阵,也就是dim函数的前两个维度:2✖3
注意的是:1:24的排列是按照第三个维度中的每一个元素排下来的,也就是说:先排完“,,1”的123456,再排“,,2”....
查看全部 -
向量是可以包含多种同一类型元素的对象
console中命令是一次性的不可重复利用
新建文件:保存和重复利用代码
注释用#
创建函数可以右键看到提示vector:
创建方法1
第一个参数是这个向量里面元素的类型,第二个参数是向量包含的原色个数,长度如是10个脚本文件中要选择这句话,点击右上角run
创建方法2
变量<-赋值1:4,即从一到四
创建方法3使用c函数,需要在这个函数中输入你需要的在这个向量中的每一个元素的内容
注意:
如果向量中每一个量的元素的类型不一样,r会强制转换成同一类型的变量
上面的例子就是r把3个不同类型的元素类型都转换成了字符类型的元素
可以自我强制转换元素的类型,添加as.,如把字符型转换成数字型
强制转换的函数:
as.numeric(参数)as.logical()
as.character()
以此类推
但是有可能会看到warning信息,因为r有可能不知道怎么把字符型转换成数字型函数,就会把无法转换的值用NA来替代
此外,记得可以用class查询向量的类型
对象的属性可以包含名称,向量中的每一个元素都是可以有名称的
names(向量x1)<-c(“a”,。。。。)
设置abcd四个是因为向量x1中有4个元素
上图可见,第一个元素的名称是a,第二个元素的名称是B,......
查看全部 -
左侧为控制台,右侧上方环境中的变量,右侧下方看绘图和包的信息和帮助文档的地方等
创建变量x,赋值符号<- 右侧环境中出现values=1
输入x然后回车:方括号1的意思是它后面接着的元素是x中第一个元素,没有方括号的1代表x中存储的内容是1
查看对象类型的函数:class
numeric:x是数值型变量,它的值可以是整数也可以是小数强调存储的是整数,只需要赋值的时候在后面加L
细节:
赋值符号<-
注意x是大写还是小写,这是不同的两个变量创建字符型变量:赋值双引号“”
逻辑型变量:真假
复数
r的对象的属性查看全部 -
列表
l <- list("a", 2, 10L, 3+4i, TRUE)
列表命名l2 <- list(a=1, b=2, c=3)
列表中每个元素中的元素个数大于1
l3 <- list(c(1,2,3), c(4,5,6,7))
矩阵行列命名
x <- matrix(1:6, nrow=2, ncol=3)
dimnames(x) <- list(c("a","b"), c("c","d","e"))
(x是一个矩阵,a.b是行的名字,d,e是列的名字)
查看全部
举报