我正在尝试将 pdf 转换为文本,并提取文本的颜色信息。我正在尝试在 golang 中执行此操作,但是使用我从 golang 调用的命令行工具是绝对可以接受的。我从 中找到pdftotext的poppler-utils,它几乎完美。只是,它没有给我颜色信息。我试过 github.com/ledongthuc/pdf,它也没有给我颜色信息。还有其他工具吗?我是否错过了使用 pdftotext 执行此操作的方法?
1 回答

慕盖茨4494581
TA贡献1850条经验 获得超11个赞
有一个名为poppler
( https://poppler.freedesktop.org ) 的 C++ 库,它允许从 PDF 文件中提取文本,包括颜色。
这里有一个 go 绑定:https ://github.com/cheggaaa/go-poppler
- 1 回答
- 0 关注
- 118 浏览
添加回答
举报
0/150
提交
取消