1 回答
TA贡献1804条经验 获得超3个赞
如果您假设字符串中至少有一个并且在它之后至少有一个,那么在您的主要验证正则表达式失败时,您可以捕获电子邮件的三个部分,并从中删除所有不需要的字符并连接回一个“干净的@” .“ 电子邮件:
import re
pattern = r'^[a-zA-Z0-9_.+-]+@[a-zA-Z0-9-]+(?:\.[a-zA-Z0-9-]+)+$'
text = "t'ogfni?fyevdsj@hmi.dev"
def repl(x):
return "{}@{}.{}".format(re.sub(r'[^a-zA-Z0-9_.+-]+', '', x.group(1)),
re.sub(r'[^a-zA-Z0-9.-]+', '', x.group(2)),
re.sub(r'[^a-zA-Z0-9.-]+', '', x.group(3)))
if re.fullmatch(pattern, text):
print("Valid email: {}".format(text))
else:
email = re.sub(r"(.*)@(.*)\.(.*)", repl, text)
print("Filtered email: {}".format(email))
查看Python 演示,输出为Filtered email: togfnifyevdsj@hmi.dev
.
还有另一种清理部分的方法@:拆分.并删除所有字符[^a-zA-Z0-9-]+中匹配的所有字符,然后将它们连接回去:
def repl(x):
return "{}@{}".format(re.sub(r'[^a-zA-Z0-9_.+-]+', '', x.group(1)),
".".join([re.sub(r'[^a-zA-Z0-9-]+', '', y) for y in x.group(2).split('.')]) )
请参阅此 Python 演示。
添加回答
举报