我正在尝试在 python 中使用 read_pdf 从 pdf 中抓取表格。我正在使用 read_pdf 但它无法完成工作。另外,值得一提的是,我在 MAC 中使用 Jupiter notebook 执行此操作。这就是我所做的:from tabula import read_pdf
file = read_pdf(r'C:\Users\myname\Rprojects\Reports_scraping\data_scraped\icnarc_29052020\icnarc_200529.pdf')我收到此错误:FileNotFoundError: [Errno 2] No such file or directory: 'C:\\Users\\myname\\Rprojects\\Reports_scraping\\data_scraped\\icnarc_29052020\\icnarc_200529.pdf'我该如何解决这个问题?
2 回答

白衣非少年
TA贡献1155条经验 获得超0个赞
只是为了检查文件是否存在,运行此命令时是否得到 True:
import os
file_path = r'C:\Users\myname\Rprojects\Reports_scraping\data_scraped\icnarc_29052020\icnarc_200529.pdf'
print( os.path.isfile(file_path))
使用文件所在的位置编辑 file_path(使用 Python 3)。你有没有用你的实际用户名更改路径中的“我的名字”......(以防万一)
最好使用 os.path.join 来构建你的路径以使事情兼容,在 Windows 上它需要创建一个根“config.py”文件,请参阅
#
与 GaB 讨论后,他似乎在 Mac 上使用 Jupyter notebook,这说明了问题,我看到了这个链接,但无能为力。

万千封印
TA贡献1891条经验 获得超3个赞
只有一种可能,文件不存在,但是你已经检查过我假设,如果没有,再次检查文件的拼写是否正确。如果这不起作用,请执行以下技巧
在与文件相同的文件夹中执行 py 代码,然后使用
from tabula import read_pdf file = read_pdf(r'icnarc_200529.pdf')
有时,这种简单的方法可以解决问题。
添加回答
举报
0/150
提交
取消