为了账号安全,请及时绑定邮箱和手机立即绑定

如何将字符串拆分为特定的关键字?

如何将字符串拆分为特定的关键字?

慕容3067478 2022-06-22 19:43:43
我正在尝试将字符串拆分为特定的关键字。我有一个关键词/字符列表。例如:我有一个关键字列表{'1', '2', '3', '4', '5', 'let', 'while'}我有一个字符串let2while4我想输出一个包含{'let', '2', while', '4'}这可能吗?我目前只使用带有 ' ' 的分隔符将其拆分谢谢!编辑:使用下面的 Gilch 的答案适用于下面的示例,但是当我输入完整的关键字时,我收到了这些错误:Traceback (most recent call last):File "parser.py", line 14, in <module>list = re.findall(f"({'|'.join(keywords)})", input)File "/usr/lib/python3.7/re.py", line 223, in findallFile "/usr/lib/python3.7/sre_parse.py", line 816, in _parsep = _parse_sub(source, state, sub_verbose, nested + 1)File "/usr/lib/python3.7/sre_parse.py", line 426, in _parse_subnot nested and not items))File "/usr/lib/python3.7/sre_parse.py", line 651, in _parsesource.tell() - here + len(this))re.error: nothing to repeat at position 17我的完整关键字包括:关键字 = {'1','2','3','4','5','6','7','8','9','0','x','y' ,'z','+','-','*','>','(',')',';','$','let','while','else',' ='}
查看完整描述

1 回答

?
万千封印

TA贡献1891条经验 获得超3个赞

用于'|'.join()从您的关键字制作正则表达式模式。


>>> keywords = {'1', '2', '3', '4', '5', 'let', 'while'}

>>> string = 'let2while4'

>>> import re

>>> re.findall('|'.join(keywords), string)

['let', '2', 'while', '4']

>>> set(_)

{'let', '2', 'while', '4'}

如果您的关键字可能包含正则表达式控制字符,您可以re.escape()在加入之前使用它们。


>>> re.findall('|'.join(map(re.escape, keywords)), string)


查看完整回答
反对 回复 2022-06-22
  • 1 回答
  • 0 关注
  • 113 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信