为了账号安全,请及时绑定邮箱和手机立即绑定

将字符串拆分为单词和标点符号

将字符串拆分为单词和标点符号

慕无忌1623718 2019-09-24 15:35:21
我正在尝试将字符串拆分为单词和标点符号,并将标点符号添加到拆分生成的列表中。例如:>>> c = "help, me">>> print c.split()['help,', 'me']我真正希望列表看起来像是:['help', ',', 'me']因此,我希望将字符串在空白处拆分,并将标点符号与单词分开。我尝试先解析字符串,然后运行拆分:>>> for character in c:...     if character in ".,;!?":...             outputCharacter = " %s" % character...     else:...             outputCharacter = character...     separatedPunctuation += outputCharacter>>> print separatedPunctuationhelp , me>>> print separatedPunctuation.split()['help', ',', 'me']这会产生我想要的结果,但是在大文件上速度很慢。有办法更有效地做到这一点吗?
查看完整描述

2 回答

  • 2 回答
  • 0 关注
  • 858 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信