为了账号安全,请及时绑定邮箱和手机立即绑定

如何使用 re.findall 提取文本?

如何使用 re.findall 提取文本?

三国纷争 2022-07-19 15:12:31
我想要从 HTML 文件中提取国家名称我从 HTML 源代码制作了一个 txt 文件我试过的https://www.flightsfrom.com/WUH/destinations我已经写了下面的代码import ref = open('/Users/User/Programming/plotly.csv/country_name.txt')data1 = f.read()print(re.findall('data_country\=(\".+\")', data1))print(re.findall('a(.*)b', 'axyzb'))txt 文件如下所示: 但是代码只是给了我这个结果:我认为这是正则表达式的问题。
查看完整描述

2 回答

?
冉冉说

TA贡献1877条经验 获得超1个赞

试试看

print(re.findall('data-country\=(\".+\")', strTmp))


查看完整回答
反对 回复 2022-07-19
?
慕桂英3389331

TA贡献2036条经验 获得超8个赞

print(re.findall('data-country\=(\".+?\")', data1)) 正是我所需要的。

print(re.findall('data-country\=(\".+\")', data1)) 给了我太长的文本,而我并不在寻找。

下次我不会截图了。相反,我将复制并发送代码。谢谢你让我知道。


查看完整回答
反对 回复 2022-07-19
  • 2 回答
  • 0 关注
  • 97 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信