正则表达式检测用于&while循环的半冒号终止C ++在我的Python应用程序中,我需要编写一个匹配C ++ for或while循环的正则表达式,该循环使用分号(;)。例如,它应匹配此:for (int i = 0; i < 10; i++);......但不是这个:for (int i = 0; i < 10; i++)这看起来很琐事,直到您意识到开括号和右括号之间的文本可能包含其他括号,例如:for (int i = funcA(); i < funcB(); i++);我正在使用python.re模块。现在我的正则表达式看起来像这样(我已经留下了我的评论,所以你可以更容易理解):# match any line that begins with a "for" or "while" statement:^\s*(for|while)\s*\( # match the initial opening parenthesis
# Now make a named group 'balanced' which matches a balanced substring.
(?P<balanced>
# A balanced substring is either something that is not a parenthesis:
[^()]
| # …or a parenthesised string:
\( # A parenthesised string begins with an opening parenthesis
(?P=balanced)* # …followed by a sequence of balanced substrings
\) # …and ends with a closing parenthesis
)* # Look for a sequence of balanced substrings\) # Finally, the outer closing parenthesis.# must end with a semi-colon to match:\s*;\s*这适用于所有上述情况,但只要你尝试使for循环的第三部分包含一个函数就会中断,如下所示:for (int i = 0; i < 10; doSomethingTo(i));我认为它会中断,因为只要在开括号和右括号之间放置一些文本,“平衡”组就会匹配包含文本,因此该(?P=balanced)部分不再起作用,因为它不匹配(由于事实括号内的文字是不同的)。
3 回答
慕森王
TA贡献1777条经验 获得超3个赞
您可以编写一个非常简单的例程,而不使用正则表达式:
设置一个位置计数器
pos
,使其指向您for
或之后的开始括号之前while
。设置一个开放的括号计数器
openBr
来0
。现在继续递增
pos
,读取相应位置的字符,并openBr
在看到左括号时递增,并在看到右括号时递减。这将在开头增加一次,对于“for (
”中的第一个开括号,对于其间的某些括号增加和减少一些,并0
在for
括号关闭时将其设置回。所以,不要当
openBr
是0
一次。
停止位置是你的结束for(...)
。现在您可以检查是否有分号。
守候你守候我
TA贡献1802条经验 获得超10个赞
这是你不应该用正则表达式做的事情。只需一次解析字符串一个字符,跟踪打开/关闭括号。
如果您正在寻找这个,那么您绝对不需要一个完整的C ++语法词法分析器/解析器。如果你想练习,你可以编写一个小的递归式解析器,但即便如此,只需匹配括号。
牧羊人nacy
TA贡献1862条经验 获得超7个赞
这是使用错误工具完成工作的一个很好的例子。正则表达式不能很好地处理任意嵌套的子匹配。你应该做的是使用一个真正的词法分析器和解析器(C ++的语法应该很容易找到)并寻找意外的空循环体。
添加回答
举报
0/150
提交
取消