python3.5遇到的一些问题及解决方案
Python3.5调试成功,有以下几点需要注意: 1.原url已经改变,为https://baike.baidu.com/item/Python/407313?fr=aladdin 2.正则匹配时,需要匹配r'/item/',与视频中也不同 3.爬取时会遇到两个问题中止程序。a:网址中含有中文,b:有些百科词条中'summary'节点是空的,程序没判断导致get_text出错。 以上问题都能够通过阅读评论自己调试,自己动手丰衣足食。 我的代码https://github.com/kangkang59812/baike_spider