为了账号安全,请及时绑定邮箱和手机立即绑定

看起来相同的字符串但不同的字节表示

看起来相同的字符串但不同的字节表示

杨__羊羊 2023-06-27 16:31:16
上面的字符串是我输入的,而底部的字符串是从数据库中提取的。bytes('TOYOTA', 'utf-8')>> b'TOYOTA'bytes('ΤΟΥΟΤΑ', 'utf-8')>> b'\xce\xa4\xce\x9f\xce\xa5\xce\x9f\xce\xa4\xce\x91'当我想检查它是否存在时,这会导致不良结果'TOYOTA' == 'ΤΟΥΟΤΑ'>> False知道如何“修复”不正确的字符串吗?
查看完整描述

1 回答

?
蓝山帝景

TA贡献1843条经验 获得超7个赞

这些似乎是希腊大写字母:


>>> import unicodedata

>>> s = 'ΤΟΥΟΤΑ'

>>> for c in s:

...     print(unicodedata.name(c))

... 

GREEK CAPITAL LETTER TAU

GREEK CAPITAL LETTER OMICRON

GREEK CAPITAL LETTER UPSILON

GREEK CAPITAL LETTER OMICRON

GREEK CAPITAL LETTER TAU

GREEK CAPITAL LETTER ALPHA

查看完整回答
反对 回复 2023-06-27
  • 1 回答
  • 0 关注
  • 162 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信