为了账号安全,请及时绑定邮箱和手机立即绑定

蜘蛛程序,怎么判断重复页面

蜘蛛程序,怎么判断重复页面

慕桂英546537 2018-08-28 08:06:46
像百度蜘蛛那样的程序,是怎么判断抓取了重复页面的呢?比如说一个登陆页面,可能有N个页面有这个链接,该怎么判断呢? 一定要判断的话“登录”页面的链接,勉强还算可以写出个判断语句来的,但要是再复杂的链接,又该怎么判断呢??麻烦高手指点下啊!!!
查看完整描述

2 回答

?
侃侃无极

TA贡献2051条经验 获得超10个赞

把链接字符串用MD5转换为 128位整数,然后放到 Dictionary 里面判断重复

查看完整回答
反对 回复 2018-08-30
  • 2 回答
  • 0 关注
  • 518 浏览

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信