最新回答 / 慕村1348781
https://github.com/bainingchao/DataProcess/tree/master/ClearText 点开就能看见源码
2019-10-27
最新回答 / 海边落地的愿
老师给了一个这个链接1 复旦新闻语料下载:链接: https://pan.baidu.com/s/1U3CtXRl-2mH24PNEzTcy8w 提取码: bxtj
2019-09-16
最新回答 / weixin_慕慕7264533
这个是列表解析式,这个part是从后面那个part过来的,比如 a = [1,2,3]b = [x for x in a],则b也等于[1,2,3]
2019-08-25
最新回答 / 宝慕林452583
print('{t} *** {i} \t docs has been dealed' .format(i=i, t=time.strftime('%Y-%m-%d %H:%M:%S',time.localtime())),'\n',catg,':\t',file[:20])file???
2019-08-09
讲师回答 / 伏草惟存
# 正则对字符串清洗def textParse(str_doc): # 正则过滤掉特殊符号、标点、英文、数字等。 r1 = '[a-zA-Z0-9’!"#$%&\'()*+,-./::;;|<=>?@,—。?★、…【】《》?“”‘’![\\]^_`{|}~]+' # 去除空格 r2 = '\s+' # 去除换行符 str_doc=re.sub(r1, ' ', str_doc) # 多个空格成1个 str_doc=re.sub(r2, '...
2019-07-22