为了账号安全,请及时绑定邮箱和手机立即绑定

如何在python中使用正则表达式提取字符串旁边的单词

如何在python中使用正则表达式提取字符串旁边的单词

慕虎7371278 2022-08-25 13:38:08
9.DATUM DER ERTEILUNG DER ZULASSUNG/VERLÄNGERUNG DER ZULASSUNG10.STAND DER INFORMATIONJuni 2019Rezeptpflicht/ApothekenpflichtRezept- und apothekenpflichtig, wiederholte Abgabe verboten.这是我的文本,我正在尝试提取总是在之后的日期。 在上面的示例文本中。STAND DER INFORMATIONJuni 2019我已经尝试了字符串拆分方法,但这对我不起作用,因为我只需要日期。
查看完整描述

1 回答

?
泛舟湖上清波郎朗

TA贡献1818条经验 获得超3个赞

如果您的文本在日期之前有 STAND DER 信息,如图所示,您可以使用以下内容。


法典


import re

re.findall(r'(?<=STAND DER INFORMATION\s)\D{3,4}\s\d{4}', s, re.MULTILINE)

解释


# s is text string

# <=STAND DER INFORMATION\n - look behind for STAND DER INFORMATION followed by \n

# \D is non-digit (so 3 or 4 non-digits)

# \d digits (so four digit date)

# re.MULTILINE - multiline flag to allow matches across multiple lines

测试


s = """9.DATUM DER ERTEILUNG DER ZULASSUNG/VERLÄNGERUNG DER ZULASSUNG

10.STAND DER INFORMATION

Juni 2019

Rezeptpflicht/Apothekenpflicht

Rezept- und apothekenpflichtig, wiederholte Abgabe verboten."""

dates = re.findall(r'(?<=STAND DER INFORMATION\n)\D{3,4}\s\d{4}', s, re.MULTILINE)

print(dates)

输出


['Juni 2019']


查看完整回答
反对 回复 2022-08-25
  • 1 回答
  • 0 关注
  • 92 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信