我有一个像 ? 这样的 unicode 字符,我想找回 \Uxxxxxxxx 格式。但直到现在,还没有找到一个简单的方法。已经尝试过:text = ?text.encode('utf-32').decode('utf-8')returns error: UnicodeDecodeError: 'utf-8' codec can't decode byte 0xff in position 0: invalid start bytetext.encode('utf-32').decode('unicode-escape')returns ÿþ如何让它返回 \U000XXXXX ?我知道我可以从 \U000XXXXX 中得到这个字符:string = "foo bar foo \U000XXXXX"string.encode('utf-8').decode('unicode-escape')returns "foo bar foo ?"
1 回答
Smart猫小萌
TA贡献1911条经验 获得超7个赞
对于字节字符串:
>>> text = '?'
>>> text.encode('unicode-escape')
b'\\U0001f3c6'
对于 Unicode 字符串:
>>> text.encode('unicode-escape').decode('ascii')
'\\U0001f3c6'
添加回答
举报
0/150
提交
取消