求解:百度百科的url变了怎么统一格式?
求解:百度百科的url变了怎么统一格式?谢谢
求解:百度百科的url变了怎么统一格式?谢谢
2017-04-08
以现在百度百科的url格式为例:
root_url 变成 root_url = "http://baike.baidu.com/item/Python"
然后把 html_parser.py 中url的正则表达换成模糊匹配 links = soup.find_all('a',href = re.compile(r"item"))
这样就可以了
以后如果网站升级,url格式改变,也是这个套路
希望能帮到你
举报