为了账号安全,请及时绑定邮箱和手机立即绑定

使用正则表达式(Python)查找单词中所有可能的 5 个字母组合

使用正则表达式(Python)查找单词中所有可能的 5 个字母组合

一只萌萌小番薯 2023-04-18 14:26:21
我是 Python 和 Regex 的新手。这是我目前的问题,我还没有在网上找到任何直接的答案。我有一个包含 5 个或更多字符的字符串,为此我需要搜索 5 个字符的所有可能组合。我想知道它是否适用于正则表达式(而不是创建一个包含所有可能的 5 个字符组合的列表,然后用我的字符串循环测试它们)。例如,假设我的字符串是“stackoverflow”,我需要一个表达式,它可以给我一个包含 5 个连续字母的所有可能组合的列表,例如:['stack', 'tacko', ackov', ... ]. (但不是例如“stcko”或“wolfr”)。这就是我要尝试的:import reword = "stackoverflow"list = re.findall(r".....", word)但是打印这个列表只会给出:['stack', 'overfl']这样看来一个位置只能匹配一次,5个字符的组合不能涉及已经匹配过的位置。谁能帮助我更好地理解正则表达式在这种情况下的工作原理,以及我的需求是否可以直接使用正则表达式?
查看完整描述

3 回答

?
慕慕森

TA贡献1856条经验 获得超17个赞

如果字母总是连续的,这将起作用:


wd = "stackoverflow" 

lst = ["".join(wd[i:i+5]) for i in range(len(wd)-4)]

print(lst)

输出


['stack', 'tacko', 'ackov', 'ckove', 'kover', 'overf', 'verfl', 'erflo', 'rflow']


查看完整回答
反对 回复 2023-04-18
?
犯罪嫌疑人X

TA贡献2080条经验 获得超4个赞

我想你可以只使用一个简单的循环和一个大小为 5 的滑动窗口


word = "stackoverflow"

result=[]

for i in range(len(word)-5):

    result.append(word[i:i+5])

print(result)

这是非常有效的,因为它在 O(n) 线性时间上运行


查看完整回答
反对 回复 2023-04-18
?
慕妹3242003

TA贡献1824条经验 获得超6个赞

因为正如我在 findall 文档字符串中看到的那样,它返回所有非重叠匹配项:


def findall(pattern, string, flags=0):

    """Return a list of all non-overlapping matches in the string.


    If one or more capturing groups are present in the pattern, return

    a list of groups; this will be a list of tuples if the pattern

    has more than one group.


    Empty matches are included in the result."""

    return _compile(pattern, flags).findall(string)

查看主题中没有使用正则表达式的解决方案。


查看完整回答
反对 回复 2023-04-18
  • 3 回答
  • 0 关注
  • 205 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信