刚开始学,python3做完了这个东西,碰到了几个问题,不知道有没有和我一样的小伙伴_init_和__init__ 的区别,当碰到异常 craw failed 可以debug看下流程,目前是可以跑的,不止只打印一个url,如果只打印了一个就是异常了,最后的解析,HTML打印汉字为16进制,data['title'].encode('utf-8').decode('utf-8')可以改为汉字 代码https://github.com/luckly1/baike.git
2018-10-03
最新回答 / Yelena_Nic
一个包是一个带有特殊文件 __init__.py 的目录。__init__.py 文件定义了包的属性和方法。其实它可以什么也不定义;可以只是一个空文件,但是必须存在。如果 __init__.py 不存在,这个目录就仅仅是一个目录,而不是一个包,它就不能被导入或者包含其它的模块和嵌套包。难怪你的 导入模块的语句都是红色波浪线啦,你创建的baike_spider是 包?吗,还是你吧__init__.py给删了?
2018-09-30