为了账号安全,请及时绑定邮箱和手机立即绑定

从多个文件中删除停用词(NLTK)

从多个文件中删除停用词(NLTK)

江户川乱折腾 2021-05-05 18:45:13
我有几个要使用的文本文件(本地文件夹),并且要从此文件夹中的每个文件中删除停用词,然后将新文件保存在一个子文件夹中。一个文件的代码:import iofrom nltk.corpus import stopwordsfrom nltk.tokenize import word_tokenizestop_words = set(stopwords.words('english'))file1 = open("1_1.txt")line = file1.read()words = line.split()for r in words:    if not r in stop_words:        appendFile = open('subfolder/1_1.txt','a')        appendFile.write(" "+r)        appendFile.close()我想我必须尝试使用glob吗?但是我似乎并不了解文档。我也许应该降低文本的文本?一定有一种超级简单的方法,但是我只为一个句子或一个文件找到教程,从不为多个文件找到教程。
查看完整描述

1 回答

  • 1 回答
  • 0 关注
  • 160 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号