为了账号安全,请及时绑定邮箱和手机立即绑定

Python中的多类文本分类

Python中的多类文本分类

动漫人物 2021-06-28 12:35:31
我正在尝试按照此处的说明创建多类文本分类器。但是,我的代码在一行中断:NB_pipeline.fit(X_train, train[category])以下是我得到的错误:File "pandas\hashtable.pyx", line 683, in pandas.hashtable.PyObjectHashTable.get_item (pandas\hashtable.c:12322)我试图找出train[category]返回的内容,但遇到了同样的错误。1)X_train是dataframe一栏,包含客户反馈。2)train是一个dataframe有两列的;第一列包含客户评论(与 相同X_train),第二列包含 5 个类别之一 ( Systems Error, Proactive Communication, Staff Behaviour, Website Functionalities, Others)。3)category是上述类别之一。以下是示例火车dataframe:Index           Feedback                                    Category  0           While making payment got system error.         System error              Staff behaviour was good at hotel  1           While making payment got system error.         Staff Behaviour              Staff behaviour was good at hotel
查看完整描述

1 回答

?
隔江千里

TA贡献1906条经验 获得超10个赞

这是最容易被忽视的问题之一。


此错误的原因是正在查找的“列”脚本在数据框中不可用。您拥有的所有 5 个类别都应该是输入数据框中的列,如果其中一个类别适用于反馈/评论,则行将占 1/0。理想情况下,您的输入数据框应如下所示。


Index           Feedback                                  System error    Staff Behaviour

  0           While making payment got system error.         1                  1

              Staff behaviour was good at hotel


  1           While making payment got system error.         1                  0


  2           Staff behaviour was good at hotel              0                  1

我使用了相同的注释来显示输入数据框的外观。


查看完整回答
反对 回复 2021-07-06
  • 1 回答
  • 0 关注
  • 156 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信