为了账号安全,请及时绑定邮箱和手机立即绑定
pdf转txt失败

mytxt = pdfapp.Documents.Open(filePath)
File "<COMObject <unknown>>", line 8, in Open
pywintypes.com_error: (-2147352567, '发生意外。', (0, 'Microsoft Word', '文件可能已经损坏。', 'wdmain11.chm', 25272, -2146822496), None)
File "G:/python文件/转txt.py", line 42, in 转txt
mytxt = wordapp.Documents.Open(filePath)
File "<COMObject <unknown>>", line 8, in Open
win32.types.com_error: (-2147352567, '发生意外。', (0, 'Kingsoft WPS', '文档打开失败。', '', 3010, -786427), None)
代码习惯真好
本教程中文本抽取借助office的win32插件处理的,mac电脑或者Linux系统可以使用Apache Tika toolkit工具。(参考文献:https://www.cnblogs.com/baiboy/p/tika.html)
用了linux你们说大多数人都不用啊,不会安装啊。用了window又来了一句程序猿谁在windows编程啊?我真TM服了这些人了,别忘了你们学的数据预处理,跟在什么平台编程有毛线关系啊???专心学知识不行吗?非要纠结平台。
linux呢?程序员谁在windows编程啊
能不能不剪掉一部分吗?能整体放出来吗?
深夜睡不着刷慕课
正好开始学NLP,给老师打call,期待继续更新!
干货同求更新
哇噻看下来觉得很棒,求老师更新~~~
课程还在更新中吗
感觉这老师low的很啊
七月初第二部分更新上线!
课程须知
1、适用于数据科学从业人员、AI技术开发人员和科研工作者及学生群体。 2、学习者应具备python和数据科学的基础。
老师告诉你能学到什么?
1、制定不同场景数据采集策略 2、文本数据抽取与集成、使用Python科学计算工具

微信扫码,参与3人拼团

意见反馈 帮助中心 APP下载
官方微信
友情提示:

您好,此课程属于迁移课程,您已购买该课程,无需重复购买,感谢您对慕课网的支持!

本次提问将花费2个积分

你的积分不足,无法发表

为什么扣积分?

本次提问将花费2个积分

继续发表请点击 "确定"

为什么扣积分?

举报

0/150
提交
取消