为了账号安全,请及时绑定邮箱和手机立即绑定

求解:百度百科的url变了怎么统一格式?

求解:百度百科的url变了怎么统一格式?谢谢

正在回答

2 回答

太好了,刚才我还遇到这个问题呢。你一下子就帮我解决了,哈哈。


0 回复 有任何疑惑可以回复我~

以现在百度百科的url格式为例:

root_url 变成 root_url = "http://baike.baidu.com/item/Python"

然后把 html_parser.py 中url的正则表达换成模糊匹配 links = soup.find_all('a',href = re.compile(r"item"))

这样就可以了

以后如果网站升级,url格式改变,也是这个套路

希望能帮到你

1 回复 有任何疑惑可以回复我~

举报

0/150
提交
取消
Python开发简单爬虫
  • 参与学习       227670    人
  • 解答问题       1219    个

本教程带您解开python爬虫这门神奇技术的面纱

进入课程

求解:百度百科的url变了怎么统一格式?

我要回答 关注问题
意见反馈 帮助中心 APP下载
官方微信