为了账号安全,请及时绑定邮箱和手机立即绑定

split中使用中文分隔符

split中使用中文分隔符

慕慕森 2019-04-16 20:27:34
我的str="【红豆杉】红豆杉作用与功效_红豆杉抗癌药品-健客网",使用re.split('【|】|-')分割该字符串,结果不是想象中的(红豆杉、红豆杉作用与功效、红豆杉抗癌药品、健客网四部分),而是出现乱码,请问对于中文字符的分割,应该采用什么办法?
查看完整描述

2 回答

?
HUX布斯

TA贡献1876条经验 获得超6个赞

#-*-coding:UTF-8-*-
importre
str=u"【红豆杉】红豆杉作用与功效_红豆杉抗癌药品-健客网"
re.split(u'【|】|-|_',str)
foriinre.split(u'【|】|-|_',str):
printi
你该去了解一下unicode
                            
查看完整回答
反对 回复 2019-04-16
?
MYYA

TA贡献1868条经验 获得超4个赞

乱码是什么?如果你是Py2.x版本的话,直接printlist或者dict是会显示乱码,而printlist[1]这样打印就不会。
这是Pythonprint对于字符串处理时做出的判断,而不能代表程序本身获取到的是乱码。
建议贴代码贴结果。
                            
查看完整回答
反对 回复 2019-04-16
  • 2 回答
  • 0 关注
  • 885 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信