为了账号安全,请及时绑定邮箱和手机立即绑定

Word 表格中的文本

Word 表格中的文本

慕码人8056858 2021-09-25 18:30:14
每天我都会收到一封带有word文档的电子邮件。文档中的所有文本都存在于文档中的一个表格中。我有数百个这样的word文档(我每天都会收到一个)。我想用python打开每个文档,复制我需要的文本,然后粘贴到一个excel文档中。但是,我被困在第一部分。我无法从word文档中提取文本。我正在尝试使用 python-docx 模块来提取文本,但我不知道如何从表格中读取文本。我在我正在阅读的 python 介绍书中修改了一个 getText 模块,但它似乎不起作用。我什至在正确的轨道上吗?import docxfullText = []def getText(filename):    doc = docx.Document(filename)    for table in doc.Tables:        for row in table.Rows:            for cell in row.Cells:                  fullText.append(cell.text)    return '\n'.join(fullText)好的,在看了另一个问题之后,我意识到我实际上遇到了与我想象的不同的问题。我进行了更改并具有以下代码:import docxfullText = []doc = docx.Document('c:\\btest\\January18.docx')for table in doc.tables:    for row in table.rows:            for cell in row.cells:                  fullText.append(cell.text)'\n'.join(fullText)print(fullText)问题是,word 文档中的表格不是空白单元格,因此它们不应该返回空白。我究竟做错了什么?示例输入文档在这里我正在尝试从该文档中提取某些文本行,并按照我想要的方式粘贴和格式化文本。但是,我什至无法访问word文档中的文本...
查看完整描述

2 回答

  • 2 回答
  • 0 关注
  • 236 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信