为了账号安全,请及时绑定邮箱和手机立即绑定

更新新列中的值

更新新列中的值

烙印99 2022-07-26 15:59:06
我想运行一个包(RAKE)从评论中提取关键短语(df['CUSTOMER_RECOMMENDATIONS_TRANS])并创建一个新列(df['keyphrase_RAKE'])来存储它们对应于每个评论。我收到一条错误消息,提示“ValueError:值的长度与索引的长度不匹配”。我知道错误背后的原因,但不知道如何解决。可以做什么?关键字返回关键短语列表。这是代码:import RAKEimport operator# Reka setup with stopword directorystop_dir = "SmartStoplist.txt"rake_object = RAKE.Rake(stop_dir)# Sample text to test RAKEdf = pd.read_excel('my.xlsx')for i in df['CUSTOMER_RECOMMENDATIONS_TRANS']:    keywords = rake_object.run(i)    df['keyphrase_RAKE'] = keywords
查看完整描述

1 回答

?
慕虎7371278

TA贡献1802条经验 获得超4个赞

您可以使用pandas.DataFrame.apply并避免 for 循环

df['keyphrase_RAKE'] = df['CUSTOMER_RECOMMENDATIONS_TRANS'].apply(rake_object.run)



查看完整回答
反对 回复 2022-07-26
  • 1 回答
  • 0 关注
  • 73 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号