已采纳回答 / 请叫我百度
第一:baike_spider是你创建的包,你所说的url_manager肯定是放在包中的代码,是可以import进去了。第二:只爬取一个网址就结束应该是html_parser中的代码有问题,比如课程中的匹配策略与现在的百度Python词条不匹配,需要改成href = re.compile(r"/item/.*") 再或者find_all 不要丢了下划线,我就没注意到下划线,所以只输出了1条记录就craw faild了。
2017-05-15
最赞回答 / qq_苦练_03710200
哥们儿看下这个链接:http://jingyan.baidu.com/article/77b8dc7fec2e0c6174eab6f8.html
2017-05-14