我想运行一个包(RAKE)从评论中提取关键短语(df['CUSTOMER_RECOMMENDATIONS_TRANS])并创建一个新列(df['keyphrase_RAKE'])来存储它们对应于每个评论。我收到一条错误消息,提示“ValueError:值的长度与索引的长度不匹配”。我知道错误背后的原因,但不知道如何解决。可以做什么?关键字返回关键短语列表。这是代码:import RAKEimport operator# Reka setup with stopword directorystop_dir = "SmartStoplist.txt"rake_object = RAKE.Rake(stop_dir)# Sample text to test RAKEdf = pd.read_excel('my.xlsx')for i in df['CUSTOMER_RECOMMENDATIONS_TRANS']: keywords = rake_object.run(i) df['keyphrase_RAKE'] = keywords
1 回答

慕虎7371278
TA贡献1802条经验 获得超4个赞
您可以使用pandas.DataFrame.apply
并避免 for 循环
df['keyphrase_RAKE'] = df['CUSTOMER_RECOMMENDATIONS_TRANS'].apply(rake_object.run)
添加回答
举报
0/150
提交
取消