课程
/后端开发
/Python
/Python数据预处理(一)一抽取多源数据文本信息
问题如标题,如何解决pdf转txt的乱码问题;另外pdf转txt时dispatch参数仍然是word.application吗,saveas中参数确定为4吗?4难道不是word转txt的吗
2019-09-15
源自:Python数据预处理(一)一抽取多源数据文本信息 2-4
正在回答
问题还是我自己通查多方资料解决了,案例中不管是pdf文件还是doc文件,都是打开word软件转格式,所以最关键的就是一个能打开pdf格式的word版本,我使用word2016可行。代码也没问题。如果运行后txt显示乱码,建议更换office版本到2016。
举报
Python数据预处理---人工智能通用技术
1 回答pdf转txt后打开乱码
3 回答在pdf转TXT时总是出现'NoneType' object has no attribute 'SaveAs'是什么情况
4 回答在pdf转TXT时总是出现'NoneType' object has no attribute 'SaveAs'是什么情况
1 回答doc文档在sublime中不能正常显示,转换出来的txt文档是乱码,怎么回事,求大神!
2 回答为什么转换中文的word文件是乱码,英文没有问题