已解决430363个问题，去搜搜看，总会有你想问的

python 爬虫书籍web scraping中的一个问题

关注

首页猿问 python 爬虫书籍web...

python 爬虫书籍web scraping中的一个问题

Python 爬虫

扬帆大鱼 2018-10-10 21:21:43

1.他最后一句话说，用Utf-8编码，使得转义字符被消除了。为什么，没懂2.content=content.decode("ascii","ignore")为何他转换成utf-8后又转成ascii?谢谢了

查看完整描述

1 回答

哆啦的时光机

TA贡献1779条经验获得超6个赞

泻药，最近比较忙，刚闲下来。
第一个问题为什么utf8能消除转义字符？
呃，其实书里这句话不对，消除转义字符的不是这行代码，而是下一行代码的ignore参数，转义字符因为不能被ascii decode，如果不加ignore就会报错，加了ignore就会被忽略。
contents是一个str，由一系列不可改变的Unicode字符组成，本身不能被decode，用utf8 encode之后转为bytes才可以被decode。
encode是转为计算机能理解的二进制数，bytes就是一系列不可改变的介于0-255之间的数字。decode就是转为我们可以理解的字符。
ascii字符集远小于unicode字符集，用ascii decode的时候那些不在ascii字符集的字符就会导致报错，设了ignore参数后就会被忽略。
这算是一个trick吧233。

话说你这本书是谁写的，这种错误太不严谨了。

反对回复 2018-10-14

1 回答
0 关注
1096 浏览

关注

添加回答

0/150

提交

取消

微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号

热搜

最近搜索清空

python 爬虫书籍web scraping中的一个问题

python 爬虫书籍web scraping中的一个问题

1 回答

添加回答