课程
                    
                        /后端开发
                        
                            /Python
                        
                        /Python开发简单爬虫

爬虫运行出出现的错误

craw 1 : http://baike.baidu.com/item/Python

craw failed: 'NoneType' object has no attribute 'find'

实在是不知道怎么解决了

qq_藞藞呀_0

2017-05-05

源自：Python开发简单爬虫 7-7

关注问题我要回答

1094

操作

收起

4 回答

SiCheng_Sheen 回答被采纳 +3 积分
2017-05-27

我之前也遇到过这种情况，纠结了很久，最后才发现一个非常重要的问题，百度的词条信息发生了变化，你可以仔细看看，现在不再是以 .htm结尾了，之前在html_parser模块中的正则表达式已经失效了，原来是href=re.compile(r"/view/\d+\.htm")，现在应该改为href=re.compile(r'/item/\w+')。这也再次证明了在采集数据前，一定要对目标进行仔细认真的分析！