为了账号安全,请及时绑定邮箱和手机立即绑定

用于将txt文件读取为一个字符串以记录逻辑的转换功能

用于将txt文件读取为一个字符串以记录逻辑的转换功能

一只甜甜圈 2021-04-07 13:14:43
该文件夹中有一堆.txt文件。以下是两个函数,用于读取这些文件并将它们保存为一个字符串的变量:s=(glob.glob("/Users/user/documents/folder/*.txt"))def read_files(files):    for filename in files:        with open(filename, 'r', encoding='latin-1') as file:            yield file.read()def read_files_as_string(files, separator='\n'):    files_content = list(read_files(files=files))    return separator.join(files_content)results=read_files_as_string(s)现在我的想法是使用sklearnCountVectorizer()来从文本中获取n-gram。但CountVectorizer()不接收作为输入的字符串。因此,我的问题是-如何使函数读取文件,而不是将它们存储为一个字符串,而是使用以下逻辑进行存储:['text1.txt','text2.txt',...,'textn。文本文件']
查看完整描述

1 回答

  • 1 回答
  • 0 关注
  • 124 浏览

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信