在Python中从Unicode字符串中剥离字符修饰符的最简单方法是什么?例如:A͋͠r͍̞̫̜͌ͦ̈́͐ͅt̼̭͞h́u̡̙̞̘̙̬͖͓rͬͣ̐ͮͥͨ̀͏̣应该成为亚瑟我尝试了文档,但找不到任何能做到这一点的东西。
2 回答
aluckdog
TA贡献1847条经验 获得超7个赞
尝试这个
import unicodedata
a = u"STRING GOES HERE" # using an actual string would break stackoverflow's code formatting.
u"".join( x for x in a if not unicodedata.category(x).startswith("M") )
这将删除所有归类为标记的字符,这是我认为您想要的。通常,您可以使用unicodedata.category获取字符的类别。
添加回答
举报
0/150
提交
取消