unicode是字符集不是实现方式,utf-8是unicode的实现方式,python3中的str类型默认是unicode字符集,这个str(unicode)是python自定义的一种实现unicode编码的对象,不能用于io操作,因为别的硬盘,或者网络不能识别python自定义的编码对象,虽然大部分别的软件都有这种自unicode定义数据。所以在进行io操作的时候必须把编码变成能识别的编码 utf-8
2016-09-06
最新回答 / ccc3ccc
是的 128个ASCII(American Standard Code for Information Interchange,美国信息交换标准代码)
2016-09-06
unicode是字符集,Utf-8是编码方式,你解释的unicode实际应该是utf-16,这种方式是通用两个字节,所以浪费空间,utf-8可以节约空间,但是浪费时间,你这个解释似乎不是很准确。。
2016-08-30
你讲错了吧,decode("UTF-8")是把你获取到的网页代码转成UNICODE编码,beautifulsoup内部有自动转换功能,这一步也不是必须的,但是最好明确的转换
2016-08-30