课程
/后端开发
/Python
/Python数据预处理(二)- 清洗文本数据
正则过滤掉特殊符号、标点、英文、数字等这段代码可以提供一下吗
2019-07-22
源自:Python数据预处理(二)- 清洗文本数据 2-4
正在回答
# 正则对字符串清洗
def textParse(str_doc):
# 正则过滤掉特殊符号、标点、英文、数字等。
r1 = '[a-zA-Z0-9’!"#$%&\'()*+,-./::;;|<=>?@,—。?★、…【】《》?“”‘’![\\]^_`{|}~]+'
# 去除空格
r2 = '\s+'
# 去除换行符
str_doc=re.sub(r1, ' ', str_doc)
# 多个空格成1个
str_doc=re.sub(r2, ' ', str_doc)
# str_doc = str_doc.replace('\n',' ')
return str_doc
举报
教会你使用Python数据预处理
1 回答老师,代码有吗
2 回答源码能分享下吗
1 回答怎么没有源代码
1 回答原始的word,pdf文件有吗?
3 回答求源码下载