我是Python-NLTK的新手。我使用电影评论数据集编写了我的代码。当我将硬编码的示例文本用于情感分析时,它工作正常,但是当我尝试获取用户输入或从文本文件中提取数据时,它会显示字母级别拆分。例如,当示例文本被硬编码时,例如[“音乐真棒”,“特效真棒”],那么拆分就像评论:音乐很棒评论:特效真棒。但是,如果我要求用户输入或从文本文件中获取数据,那么它会显示评论为;评论:M 评论:u评论:S评论:我评论:c评论:。#For文本文件 以下是我的示例代码。t = open ("Sample1.txt", "r") File_input = (t.read())for review in File_input: print ("\nReview:", review) probdist = classifier.prob_classify(extract_features(review.split())) pred_sentiment = probdist.max()print ("Predicted sentiment:", pred_sentiment) print ("Probability:", round(probdist.prob(pred_sentiment), 5))#For用户输入 以下是我的示例代码。User_input = input("Enter your value: ")for review in User_input: print ("\nReview:", review) probdist = classifier.prob_classify(extract_features(review.split())) pred_sentiment = probdist.max()print ("Predicted sentiment:", pred_sentiment) print ("Probability:", round(probdist.prob(pred_sentiment), 3))请指导。谢谢!
1 回答
www说
TA贡献1775条经验 获得超8个赞
变量是一个字符串,因此迭代它就是迭代字符,您要做的是删除循环并将其视为评论,假设它包含1个评论,否则您可以在评论之间定义一个分离字符并迭代如下:User_input
for
User_input
for review in User_input.split(sep_char):
添加回答
举报
0/150
提交
取消