已解决430363个问题，去搜搜看，总会有你想问的

python3用urllib爬网页，为什么得到的html只有上半部分？

首页猿问 ...

python3用urllib爬网页，为什么得到的html只有上半部分？

浮云间 2018-07-11 17:13:36

python版本3.7.0在使用urllib爬虫获取网页html代码时，编码时报错，忽略掉错误。html = data.decode(charset,errors='ignore')得到的html只有上半部分。而网页本应该已</html>结尾的。就是说丢失了一部分。请问各位大神这是什么情况？网上都搜不到结果。难道就我一个人遇到吗？话说python写爬虫确实快，但我刚开始都踩了好几个坑了。

查看完整描述