为了账号安全,请及时绑定邮箱和手机立即绑定

我想知道那些词条是以什么方式搜索出来的?

我想知道那些词条是以什么方式搜索出来的?对应的代码是在哪部分?

正在回答

1 回答

当第一个页面被分析之后,会获取到该页面上的其他词条的跳转url,也就是/view/*****.html,然后这些url会被拼装成完整的url加入到set中,程序循环一次之后检查set是否为空,如果不为空就会拿一个新的url去爬取,新的页面也会有些引用的词条的,然后就源源不断的有新的词条地址添加到set中去了,代码就是分析模块中使用正则表达式的那部分

1 回复 有任何疑惑可以回复我~
#1

WIM0912 提问者

完美
2016-10-05 回复 有任何疑惑可以回复我~

举报

0/150
提交
取消
Python开发简单爬虫
  • 参与学习       227670    人
  • 解答问题       1219    个

本教程带您解开python爬虫这门神奇技术的面纱

进入课程

我想知道那些词条是以什么方式搜索出来的?

我要回答 关注问题
意见反馈 帮助中心 APP下载
官方微信