为了账号安全,请及时绑定邮箱和手机立即绑定

最赞回答 / 宝慕林452583
https://github.com/bainingchao/DataProcess

最新回答 / 慕村1348781
https://github.com/bainingchao/DataProcess/tree/master/ClearText 点开就能看见源码

最新回答 / 海边落地的愿
老师给了一个这个链接1 复旦新闻语料下载:链接: https://pan.baidu.com/s/1U3CtXRl-2mH24PNEzTcy8w 提取码: bxtj 

最新回答 / 慕梦前来
你是怎么写的输出呢?看一下代码

最新回答 / weixin_慕慕7264533
这个是列表解析式,这个part是从后面那个part过来的,比如 a = [1,2,3]b = [x for x in a],则b也等于[1,2,3]

最新回答 / 慕勒4408313
我的问题解决方法是路径中的\符号改为/符号即可。

最新回答 / 宝慕林452583
print('{t} *** {i} \t docs has been dealed'                      .format(i=i, t=time.strftime('%Y-%m-%d %H:%M:%S',time.localtime())),'\n',catg,':\t',file[:20])file???

最新回答 / AI人工智能AI
https://github.com/bainingchao/DataProcess

讲师回答 / 伏草惟存
https://github.com/bainingchao/DataProcess

讲师回答 / 伏草惟存
https://github.com/bainingchao/PyDataPreprocessing

讲师回答 / 伏草惟存
表示该文档类别下某个词的概率。其中10代表这个特征词的所在位置的序号

讲师回答 / 伏草惟存
# 正则对字符串清洗def textParse(str_doc):    # 正则过滤掉特殊符号、标点、英文、数字等。    r1 = '[a-zA-Z0-9’!"#$%&\'()*+,-./::;;|<=>?@,—。?★、…【】《》?“”‘’![\\]^_`{|}~]+'    # 去除空格    r2 = '\s+'    # 去除换行符    str_doc=re.sub(r1, ' ', str_doc)    # 多个空格成1个    str_doc=re.sub(r2, '...

讲师回答 / 伏草惟存
你可以借助jiagu或者jieba分词,性能都差不多。
课程须知
1、本课程面向一定编程基础的计算机专业、软件工程专业、通信专业、电子技术专业和自动化专业的学生。 2、本课程也适用于大数据从业者及人工智能相关工程人员。 3、任何有兴趣的同学均适合学习。
老师告诉你能学到什么?
1、掌握不同分词工具与适用场景 2、掌握文本特征选择与提取方法

微信扫码,参与3人拼团

意见反馈 帮助中心 APP下载
官方微信
友情提示:

您好,此课程属于迁移课程,您已购买该课程,无需重复购买,感谢您对慕课网的支持!

本次提问将花费2个积分

你的积分不足,无法发表

为什么扣积分?

本次提问将花费2个积分

继续发表请点击 "确定"

为什么扣积分?

举报

0/150
提交
取消