如何利用样本函数将数据分割成训练/测试集我刚刚开始使用R,我不知道如何将数据集与以下示例代码合并:sample(x, size, replace = FALSE, prob = NULL)我有一个数据集,我需要投入培训(75%)和测试(25%)集。我不知道我应该把什么信息放进x和尺码里?x是数据集文件吗?我有多少个样本?
3 回答
汪汪一只猫
TA贡献1898条经验 获得超8个赞
有许多实现数据分区的方法。要获得更完整的方法,请查看createDataPartition函数中的caret包裹。
下面是一个简单的例子:
data(mtcars)
## 75% of the sample size
smp_size <- floor(0.75 * nrow(mtcars))
## set the seed to make your partition reproducible
set.seed(123)
train_ind <- sample(seq_len(nrow(mtcars)), size = smp_size)
train <- mtcars[train_ind, ]
test <- mtcars[-train_ind, ]
- 3 回答
- 0 关注
- 459 浏览
添加回答
举报
0/150
提交
取消