为了账号安全,请及时绑定邮箱和手机立即绑定

去除unicode字符修饰符

去除unicode字符修饰符

慕尼黑5688855 2021-03-20 18:15:20
在Python中从Unicode字符串中剥离字符修饰符的最简单方法是什么?例如:A͋͠r͍̞̫̜͌ͦ̈́͐ͅt̼̭͞h́u̡̙̞̘̙̬͖͓rͬͣ̐ͮͥͨ̀͏̣应该成为亚瑟我尝试了文档,但找不到任何能做到这一点的东西。
查看完整描述

2 回答

?
aluckdog

TA贡献1847条经验 获得超7个赞

尝试这个


import unicodedata

a = u"STRING GOES HERE" # using an actual string would break stackoverflow's code formatting.

u"".join( x for x in a if not unicodedata.category(x).startswith("M") )

这将删除所有归类为标记的字符,这是我认为您想要的。通常,您可以使用unicodedata.category获取字符的类别。


查看完整回答
反对 回复 2021-04-01
  • 2 回答
  • 0 关注
  • 159 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信