最新回答 / 刘轶铭
或者在'html_parser' 中,改成:
links = soup.find_all('a', href=re.compile(r"/item/.*"))
2019-01-30
最新回答 / 过好每一天1
基本原理,需要花费时间细读理解记住,否则你还会回来看,根据自身条件最好再对着源码去理解,毕竟原理和实现还是有不少差别,还有代码是敲出来的;大部分技术书籍上的都是过时的,包括学习网站的,学会自己根据网站api去学习,工作中带着疑问去学习效率比较高,摆脱复制黏贴,还有隔一段时间再回头审查自己写过的接口,你会想优化它,那就做吧,代码一定要规范,推荐sona。建议写博客记录下你学习和工作中碰到的问题以及如何解决的,希望能帮助你。
2019-01-28
最新回答 / YAAnnnnnnnnn
这是编码错误,gbk编码不能够输出为正确的编码格式。原因是win8的python3的默认编码不是utf8,我们只需要将默认编码改为utf8就能解决这个问题,参见下面的代码:
import sys, io sys.stdout = io.TextIOWrapper(sys.stdout.buffer,encoding='utf8') # Change default encoding to utf8
2019-01-05
最新回答 / 慕粉3535685
你这个url_manager.py里面的has_new_url()方法,返回的东西写错了。不是返回len(self.add_new_urls) != 0是返回
len(self.new_urls) != 0
2019-01-02