为了账号安全,请及时绑定邮箱和手机立即绑定

从数据框中提取文本特征并将其与其他类型的特征(异构数据)一起用于 sklearn 目的:

从数据框中提取文本特征并将其与其他类型的特征(异构数据)一起用于 sklearn 目的:

慕斯王 2023-10-18 20:45:53
我试图从类似于此的数据框中提取一些特征:feature1:float feature2:float feature3:string succeeded:boolean我远不是该主题的专家,但我尝试了以下操作:from sklearn.feature_extraction.text import CountVectorizerimport scipy as spvectorizer = CountVectorizer()vectorizer.fit(small_df.feature3)X = sp.sparse.hstack( (vectorizer.transform(small_df.feature3),                 small_df[['feature1', 'feature2']),                 format='csr')X_columns = vectorizer.get_feature_names() + df[cols].columns.tolist()但是,我最终遇到以下错误: TypeError: no supported conversion for types: (dtype('int64'), dtype('O'))任何帮助,将不胜感激!
查看完整描述

1 回答

?
撒科打诨

TA贡献1934条经验 获得超2个赞

解决方案:

X = sp.sparse.hstack( (vectorizer.transform(small_df.name),
                 small_df[cols].values.astype(np.float)))


查看完整回答
反对 回复 2023-10-18
  • 1 回答
  • 0 关注
  • 105 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信