为了账号安全,请及时绑定邮箱和手机立即绑定

讲师回答 / 伏草惟存
https://github.com/bainingchao/DataProcess

讲师回答 / 伏草惟存
https://github.com/bainingchao/PyDataPreprocessing

讲师回答 / 伏草惟存
表示该文档类别下某个词的概率。其中10代表这个特征词的所在位置的序号

讲师回答 / 伏草惟存
# 正则对字符串清洗def textParse(str_doc):    # 正则过滤掉特殊符号、标点、英文、数字等。    r1 = '[a-zA-Z0-9’!"#$%&\'()*+,-./::;;|<=>?@,—。?★、…【】《》?“”‘’![\\]^_`{|}~]+'    # 去除空格    r2 = '\s+'    # 去除换行符    str_doc=re.sub(r1, ' ', str_doc)    # 多个空格成1个    str_doc=re.sub(r2, '...

讲师回答 / 伏草惟存
你可以借助jiagu或者jieba分词,性能都差不多。

讲师回答 / 伏草惟存
https://github.com/bainingchao/PyDataPreprocessing

讲师回答 / 伏草惟存
全部视频已经录制完毕,等待慕课网工作人员择时推送
课程须知
1、本课程面向一定编程基础的计算机专业、软件工程专业、通信专业、电子技术专业和自动化专业的学生。 2、本课程也适用于大数据从业者及人工智能相关工程人员。 3、任何有兴趣的同学均适合学习。
老师告诉你能学到什么?
1、掌握不同分词工具与适用场景 2、掌握文本特征选择与提取方法

微信扫码,参与3人拼团

意见反馈 帮助中心 APP下载
官方微信
友情提示:

您好,此课程属于迁移课程,您已购买该课程,无需重复购买,感谢您对慕课网的支持!

本次提问将花费2个积分

你的积分不足,无法发表

为什么扣积分?

本次提问将花费2个积分

继续发表请点击 "确定"

为什么扣积分?

举报

0/150
提交
取消