为了账号安全,请及时绑定邮箱和手机立即绑定

合并几个txt。多行文件到一个 csv 文件(1 行 = 1 个文档)用于主题建模

合并几个txt。多行文件到一个 csv 文件(1 行 = 1 个文档)用于主题建模

侃侃尔雅 2022-12-20 12:31:10
到目前为止,我有 30 个文本文件,它们都有多行。我想根据本教程应用 LDA 模型。所以,对我来说它应该是这样的:text of document1 text of document2 text of document3  ..... text of document30但是特定文档的整个文本必须在一行上。我试过这篇文章,出于某种原因,它一直在说:csv_output.writerow(row[1] for row in csv_text) IndexError: list index out of range。有什么想法吗?当然,我以相同的方式命名文档并编辑了范围。基本上,我不关心我们是否可以用 python 解决这个问题。我刚刚受够了我的神经所以我真的很感激每一个帮助
查看完整描述

2 回答

?
蝴蝶刀刀

TA贡献1801条经验 获得超8个赞

我不确定您要完成什么,但是要删除文本文件的换行符并使用结果制作一个大文本文件,以下内容应该有效:

for i in *.txt; do NEW=` cat $i | tr '\n' ' '` ; echo $NEW  >> output.txt; done


查看完整回答
反对 回复 2022-12-20
?
绝地无双

TA贡献1946条经验 获得超4个赞

遍历文件,从 1 到 31(最后一个被 range() 函数跳过:


with open("lda_datafile.csv", "w", newline="") as wf:

    csv_output = csv.writer(wf)

    for x in range(1, 31):

        filepath = os.path.normpath(r"C:\Text\file{}.txt".format(x))

        with open(filepath, "r", newline="") as rf:

            csv_text = csv.reader(rf, delimiter=":", skipinitialspace=True)

            csv_output.writerow(row[1] for row in csv_text)


查看完整回答
反对 回复 2022-12-20
  • 2 回答
  • 0 关注
  • 100 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信