我正在开发一个 python 自动化脚本,我想根据正则表达式匹配提取特定段落,但我不知道如何提取该段落。以下是我的案例的示例:解决方案:(一致模式)我要提取的段落(不一致模式)远程值:x(一致模式)以下是我目前正在制作的程序,如果有人能启发我,那就太好了!import retest= 'Solution\s:'test1='Remote'with open('<filepath>', 'r') as extract: lines=extract.readlines() for line in lines: x = re.search(test, line) y = re.search(test1, line) if x is not y: f4.write(line) print('good') else: print('stop')
1 回答
慕桂英3389331
TA贡献2036条经验 获得超8个赞
这可以使用正则表达式轻松完成,例如:
import re
text = r"""
Solution\s:
The paragraph I
want to extract
Remote
Some useless text here
Solution\s:
Another paragraph
I want to
extract
Remote
"""
m = re.findall(r"Solution\\s:(.*?)Remote", text, re.DOTALL | re.IGNORECASE)
print(m)
其中text表示一些感兴趣的文本(例如,从文件中读取),我们希望从中提取哨兵模式Solution\s:和之间的所有部分Remote。在这里,我们使用 IGNORECASE 搜索,以便即使使用不同的大小写拼写,也可以识别哨兵模式。
上面的代码输出:
['\nThe paragraph I\nwant to extract\n', '\nAnother paragraph\nI want to\nextract\n']
请阅读https://docs.python.org/3/library/re.html上的 Python re 库文档了解更多详细信息。
添加回答
举报
0/150
提交
取消