已解决430363个问题，去搜搜看，总会有你想问的

使用 Python 将中文 Unicode 码位转换为字符串

首页猿问使用 Python 将中文...

使用 Python 将中文 Unicode 码位转换为字符串

Python

慕田峪9158850 2022-07-26 15:49:12

我有一个包含 8105 个中文字符的Unicode 代码点的文件，看起来类似于U+516DU+4E03U+516B我理解这些代表以下汉字六 [Chinese character for 'six', Reference http://hanzidb.org/character/%E5%85%AD]七 [Chinese character for 'seven', Reference http://hanzidb.org/character/%E4%B8%83]八 [Chinese character for 'eight', Reference http://hanzidb.org/character/%E5%85%AB]如何使用 Python 3 将包含字符串U+516D, U+4E03,的文件转换U+516B为对应的汉字？任何帮助，将不胜感激。提前致谢。

查看完整描述

2 回答

HUX布斯

TA贡献1876条经验获得超6个赞

def get_character(string):

return chr(int(string[2:], 16))

>>> get_character("U+4E03")

'七'

>>> get_character("U+516D")

'六'

>>> get_character("U+4E03")

'七'

>>> get_character("U+516B")

'八'

这是我所知道的最简单的方法，注意它不会检查正确的格式，只是砍掉前 2 个字符，假设U+

反对回复 2022-07-26

慕容708150

TA贡献1831条经验获得超4个赞

此正则表达式会将U+hhhh格式（4-6 个十六进制字符）的文本转换为其相应的 Unicode 代码点：

import re

s = 'U+516D U+4E03 U+516B'

s = re.sub(r'U\+([0-9A-F]{4,6})',lambda m: chr(int(m.group(1),16)),s)

print(s)

输出：

六七八

反对回复 2022-07-26

2 回答
0 关注
267 浏览

关注

添加回答

0/150

提交

取消

微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号

热搜

最近搜索清空

使用 Python 将中文 Unicode 码位转换为字符串

使用 Python 将中文 Unicode 码位转换为字符串

2 回答

添加回答