为了账号安全,请及时绑定邮箱和手机立即绑定

match()和group()一些疑问,如下所示:

match()和group()一些疑问,如下所示:

莫回无 2023-04-04 21:17:38
m = re.match(r"(..)+", "a1b2c3")  # Matches 3 times.m.group(1)                        # Returns only the last match.'c3'm.group(0)'a1b2c3'm.groups() ('c3',)注意到pattern中的+,应该是匹配偶数个字符.1.首先是match的问题.match是从开头匹配,为什么会匹配到c3呢?2.group(0)是整个匹配项,为什么groups()中没有呢?
查看完整描述

3 回答

?
噜噜哒

TA贡献1784条经验 获得超7个赞

1) 从group的角度考虑,整个表达式应该写作((..)+)。所以最高一层group(0)匹配整个字符串。
2) 先说第二个问题,按照文档的描述的行为,group()是列出从编号1开始的所有group,而给定的表达式只有一个group,所以自然就是c3了
3) 好,最后是为什么group(1)是c3。如果你的正则表达式没有那个“+”,那么它就只匹配a1。而有了“+”之后,每匹配到一个“(..)”就会放到group(1)中。所以跑完整个字符串,group(1)就存进了c3

我猜你其实想问“字符串中明明有三个符合(..)的,但为什么只出现了最后一个呢?”原因是,group说的是正则表达式中的括号,而不是字符串中符合括号内pattern的子串。


查看完整回答
反对 回复 2023-04-07
?
翻阅古今

TA贡献1780条经验 获得超5个赞

我也是正则苦手, T_T

re.compile(r".{2}").findall("a1b2c3")


查看完整回答
反对 回复 2023-04-07
?
慕妹3242003

TA贡献1824条经验 获得超6个赞

1.首先是match的问题.match是从开头匹配,为什么会匹配到c3呢?
首先不考虑捕获的问题,去掉捕获的(?:..)+是匹配2个任意字符的多个子串,当然可以匹配到c3.
2.group(0)是整个匹配项,为什么groups()中没有呢?
需要从表达式的解析说起,表达式的字面义上看只有一对括号,因此(..)+只有1个group(1)的捕获组,每次捕获都存在1号捕获组。
而group(0)的实现是把历史匹配过成功的字符串返回,与捕获组无关:

>> m = re.match(r"(..)..(..)", "a1b2c3")
>> m.groups()


('a1', 'c3')

>> m.group(0)


'a1b2c3'
而groups的实现其实是group(1-99),因此group只支持到99个。因此groups也只有一个捕获组的内容会给你:)


查看完整回答
反对 回复 2023-04-07
  • 3 回答
  • 0 关注
  • 106 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信