我正在尝试将字符串拆分为单词和标点符号,并将标点符号添加到拆分生成的列表中。例如:>>> c = "help, me">>> print c.split()['help,', 'me']我真正希望列表看起来像是:['help', ',', 'me']因此,我希望将字符串在空白处拆分,并将标点符号与单词分开。我尝试先解析字符串,然后运行拆分:>>> for character in c:... if character in ".,;!?":... outputCharacter = " %s" % character... else:... outputCharacter = character... separatedPunctuation += outputCharacter>>> print separatedPunctuationhelp , me>>> print separatedPunctuation.split()['help', ',', 'me']这会产生我想要的结果,但是在大文件上速度很慢。有办法更有效地做到这一点吗?
添加回答
举报
0/150
提交
取消