课程
                    
                        /后端开发
                        
                            /Python
                        
                        /Python开发简单爬虫

输出的结果是百度百科Python词条下的链接吗？

输出的结果是百度百科Python词条(https://baike.baidu.com/item/Python/407313)文章里的链接吗？好像输出的结果很多都已经不是“Python”词条下的链接。“小岗村”都出来了。而很多在此文章里的链接却没抓到。

这是跟parser的正则表达是有关吗？用了几个尝试，都无法解决

links = soup.find_all('a', href=re.compile(r"/item"))

links = soup.find_all('a', href=re.compile(r"/item/*"))

links = soup.find_all('a', href=re.compile(r'/item/[\\%\\w]+'))

guchao_0001

2017-11-20

源自：Python开发简单爬虫 7-7

关注问题我要回答

890

操作

收起

1 回答

qq_安分守己_0
2017-11-21

是的啊

0 回复有任何疑惑可以回复我~

收起回答

0/150

提交

取消

Python开发简单爬虫

参与学习 227558 人
解答问题 1288 个

本教程带您解开python爬虫这门神奇技术的面纱

进入课程

输出的结果是百度百科Python词条下的链接吗？

我要回答关注问题

热搜

最近搜索清空

输出的结果是百度百科Python词条下的链接吗？

1 回答

输出的结果是百度百科Python词条下的链接吗？