为了账号安全,请及时绑定邮箱和手机立即绑定

已采纳回答 / 慕村1348781
问题还是我自己通查多方资料解决了,案例中不管是pdf文件还是doc文件,都是打开word软件转格式,所以最关键的就是一个能打开pdf格式的word版本,我使用word2016可行。代码也没问题。如果运行后txt显示乱码,建议更换office版本到2016。

讲师回答 / 伏草惟存
关闭资源管理器,word进程,重新启动试试

讲师回答 / 伏草惟存
Ctrl+Shift+N(N:1-8)例如:Ctrl+Shift+2  左右分屏Ctrl+Shift+8  上下分屏备注:也可以使用pycharm,可以进行调试,或者其他py工具

讲师回答 / 伏草惟存
这里借助office的win32插件处理的,mac电脑或者Linux系统可以使用Apache Tika toolkit工具。(参考文献:https://www.cnblogs.com/baiboy/p/tika.html)

讲师回答 / 伏草惟存
这里借助office的win32插件处理的,mac电脑或者Linux系统可以使用Apache Tika toolkit工具。(参考文献:https://www.cnblogs.com/baiboy/p/tika.html)
课程须知
1、适用于数据科学从业人员、AI技术开发人员和科研工作者及学生群体。 2、学习者应具备python和数据科学的基础。
老师告诉你能学到什么?
1、制定不同场景数据采集策略 2、文本数据抽取与集成、使用Python科学计算工具

微信扫码,参与3人拼团

意见反馈 帮助中心 APP下载
官方微信
友情提示:

您好,此课程属于迁移课程,您已购买该课程,无需重复购买,感谢您对慕课网的支持!

本次提问将花费2个积分

你的积分不足,无法发表

为什么扣积分?

本次提问将花费2个积分

继续发表请点击 "确定"

为什么扣积分?

举报

0/150
提交
取消