Python数据预处理（一）一抽取多源数据文本信息_技术问答

首页免费课 Python数据预处理（一）一抽取多源数据文本信息问答

Python数据预处理（一）一抽取多源数据文本信息

                
                伏草惟存
            算法工程师

                    查看讲师更多课程 
                    伏草惟存讲师的其他课程
                
Python数据预处理（四）- 特征降维与可视化
初级·6914
免费课程
                                
Python数据预处理（三）- 文本特征向量化
初级·5130
免费课程
                                
Python数据预处理（二）- 清洗文本数据
中级·9462
免费课程
                                
自然语言处理（NLP）入门与实践
初级·14858
免费课程
                                
                难度初级
            
                时长 1小时38分
            
                学习人数
            
综合评分9.23
                            24人评价
                        查看评价
                                9.3
                                内容实用
                            
                                8.7
                                简洁易懂
                            
                                9.7
                                逻辑清晰

全部评论问答未解决精华

qq_一注擒庄_0

竟然管这个叫抽取

0 2-8 遍历文件批量抽取文本内容（2）

2024-11-28

qq_浮華塵世荒年痛_03476721

那个 transfile 函数，直接传一个 filetypes ，再一个 for 循环来判断啊

0 2-5 封装多格式的文本信息抽取工具

2023-12-21

慕田峪3111503

代码地址在哪

1 1-1 什么是数据预处理

2023-07-08

慕九州4487706

挺不错的呢

0 2-3 抽取word文档文本内容

2023-04-08

慕九州4487706

不错特别好

0 2-2 文本抽取问题

2023-04-08

娜娜子8813483

用的啥，，

0 2-5 封装多格式的文本信息抽取工具

2022-10-20

慕虎0217850

AttributeError: 'NoneType' object has no attribute 'SaveAs'

0 2-3 抽取word文档文本内容

2022-09-14

异凉聪

http://www.bilibili.com/video/av9784617?from=search&seid=4789969907129537329

0 2-8 遍历文件批量抽取文本内容（2）

2022-03-22

慕桂英4568597

访问页面不存在

1 2-3 抽取word文档文本内容

2021-11-26

慕桂英4568597

希望老师更新！！！！！！

1 1-5 开发环境说明

2021-11-26

qq_折腾了才是人生_0

抽取的pdf是单层pdf 还是双层的？

0 2-4 抽取PDF文档文本内容

2020-08-09

yuzhewo

讲的有点啰嗦，文本提取可以使用 textract 可以提取多种格式 https://textract.readthedocs.io/en/stable/，
文件操作获取文件名部分，可以用os.path.splitext拆分文件名称与后缀，用in判断后缀是否是要转换的格式，然后文件名+'.txt'就可以了。

2020-08-01

yuzhewo

https://github.com/deanmalmgren/textract

1 2-5 封装多格式的文本信息抽取工具

2020-07-30

慕无忌5033259

抽取表格和ppt的是不是难，所以不写

0 2-5 封装多格式的文本信息抽取工具

2020-06-16

慕移动4548395

源码获取没有提到啊？

3 1-1 什么是数据预处理

2020-06-03

开始学习

课程须知: 1、适用于数据科学从业人员、AI技术开发人员和科研工作者及学生群体。 2、学习者应具备python和数据科学的基础。

老师告诉你能学到什么？: 1、制定不同场景数据采集策略 2、文本数据抽取与集成、使用Python科学计算工具

微信扫码，参与3人拼团

热搜

最近搜索清空

Python数据预处理（一）一抽取多源数据文本信息