为了执行二进制预测,我有5个特征,我想将其用于我的随机森林分类器,其中两个根本没有被利用。我知道这是机器学习的全部意义,只选择有用的特征,但其他三个特征可能有偏见的数据,我想确保我的所有特征都以相同的权重使用来运行我的分类器。我找不到这个问题的直接答案。我用在这项工作。任何意见/建议将不胜感激。sklearnpython
2 回答
幕布斯6054654
TA贡献1876条经验 获得超7个赞
您可以通过设置 来请求随机森林分类器中每个分割中正在考虑的所有特征。max_features = None
从文档中:
max_features:整型、浮点型、字符串或无,可选(默认为“自动”)
寻找最佳拆分时要考虑的功能数量:
如果为 int,则在每次分割时考虑特征。
max_features
如果是浮点数,则为分数,并且在每次拆分时都会考虑特征。
max_features
int(max_features * n_features)
如果“自动”,则 .
max_features=sqrt(n_features)
如果为“sqrt”,则(与“自动”相同)。
max_features=sqrt(n_features)
如果为“log2”,则 .
max_features=log2(n_features)
如果为“无”,则 .
max_features=n_features
为什么使用单个树的随机森林比决策树分类器好得多?中的答案可能有助于解释和提供一些上下文。
牧羊人nacy
TA贡献1862条经验 获得超7个赞
它可以帮助你的是设置参数max_feature = 1,因此每个节点将采用(均匀分布)随机特征,并且将强制使用它。但是,您还需要设置树的深度,因为它将无限地添加点头,直到接收到主要特征之一。
添加回答
举报
0/150
提交
取消