输出的结果是百度百科Python词条下的链接吗?
输出的结果是百度百科Python词条(https://baike.baidu.com/item/Python/407313)文章里的链接吗? 好像输出的结果很多都已经不是“Python”词条下的链接。“小岗村”都出来了。而很多在此文章里的链接却没抓到。
这是跟parser的正则表达是有关吗?用了几个尝试,都无法解决
links = soup.find_all('a', href=re.compile(r"/item"))
links = soup.find_all('a', href=re.compile(r"/item/*"))
links = soup.find_all('a', href=re.compile(r'/item/[\\%\\w]+'))