为了账号安全,请及时绑定邮箱和手机立即绑定

扫描的pdf文件要怎么能转化为图片?(用pyton)

扫描的pdf文件要怎么能转化为图片?(用pyton)

pymupdf只能提取出文字清晰的pdf。使用wand的时候有些pdf处理不了,会报图像出错的bug,那些wand处理的不了pdf几乎都是扫描的pdf。判断扫描的pdf可能是文字不清晰,也可能是格式问题。不容易处理。所以,想要把pdf转化为图片,然后再用ocr识别图片中的文字。下面代码,用wand把pdf转化为图片,不过pdf为扫描文件的时候会报错CorruptImageError: unable to read image datafrom __future__ import print_function from wand.image import Image   filePath="C:/Users/wt271/Downloads/康熙教子庭训格言.pdf" with Image(filename=filePath) as img:     print('pages = ', len(img.sequence))       with img.convert('png') as converted:         converted.save(filename='imagetest/page.png')
查看完整描述

目前暂无任何回答

  • 0 回答
  • 0 关注
  • 1847 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信