为了账号安全,请及时绑定邮箱和手机立即绑定

Tabula 不识别表格

Tabula 不识别表格

HUX布斯 2023-04-18 16:33:16
我有一个简单的 python 程序,它接收 pdf(带有表格)并使用 tabula 将数据保存到 csv 文件中:import tabulaif __name__ == '__main__':path = input('Filename: ')pathSegments = path.split('/')folder = ''i = 0while i < len(pathSegments)-1:    folder += '/' + pathSegments[i]    i += 1name = pathSegments[len(pathSegments)-1].split('.')[0]dest = folder + '/' + name + '.csv'print(dest)tabula.convert_into(path, dest, pages = "all", output_format = "csv")我尝试了多种不同的 pdf,例如一张带有下图的 pdf:然而,结果始终是一个空的 csv 文件,tabula 似乎无法识别表格
查看完整描述

1 回答

?
当年话下

TA贡献1890条经验 获得超9个赞

Tabula 在收拾桌子方面并不完美。我会考虑添加一个模板来为 tabula 提供更多指导。这些模板可以根据文档的不同特征动态生成。

查看完整回答
反对 回复 2023-04-18
  • 1 回答
  • 0 关注
  • 147 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信