我有一个庞大的数据集,其中混合了数值变量和分类变量。我遇到过各种特征选择技术,主要关注数字或分类数据,而不是它们的混合。是否有任何特征选择技术适用于这样的数据集?
1 回答
慕妹3242003
TA贡献1824条经验 获得超6个赞
您正在寻找 Boruta 包,它最初是用 R 编写的,但也可以在 python 中使用。Boruta 使用随机森林对特征进行排名,但您首先必须处理特征中的所有缺失值,否则 boruta 会引发错误。在这里查看更多信息:
https://datascience.stackexchange.com/questions/31112/boruta-feature-selection-package
添加回答
举报
0/150
提交
取消