为了账号安全,请及时绑定邮箱和手机立即绑定

MySQL中的utf8mb4和utf8字符集有什么区别?

MySQL中的utf8mb4和utf8字符集有什么区别?

达令说 2019-07-23 19:02:00
MySQL中的utf8mb4和utf8字符集有什么区别?MySQL中utf8mb4和utf8charsets有什么区别?我已经知道ASCII,UTF-8,UTF-16和UTF-32编码; 但我很想知道utf8mb4编码组与MySQL服务器中定义的其他编码类型的区别。是否有任何特殊利益/建议使用utf8mb4而不是utf8?
查看完整描述

3 回答

?
神不在的星期二

TA贡献1963条经验 获得超6个赞

UTF-8是可变长度编码。在UTF-8的情况下,这意味着存储一个代码点需要一到四个字节。但是,名为“utf8”(别名为“utf8mb3”)的MySQL编码每个代码点最多只能存储三个字节。

因此字符集“utf8”/“utf8mb3”不能存储所有Unicode代码点:它只支持0x000到0xFFFF的范围,称为“ 基本多语言平面 ”。另请参见Unicode编码的比较

这是MySQL文档必须说明的(同一页面的先前版本):

名为utf8 [/ utf8mb3]的字符集每个字符最多使用三个字节,仅包含BMP字符。从MySQL 5.5.3开始,utf8mb4字符集每个字符最多使用四个字节,支持补充字符:

  • 对于BMP字符,utf8 [/ utf8mb3]和utf8mb4具有相同的存储特性:相同的代码值,相同的编码,相同的长度。

  • 对于补充字符,utf8 [/ utf8mb3]根本不能存储字符,而utf8mb4需要四个字节来存储它。由于utf8 [/ utf8mb3]根本无法存储字符,因此在utf8 [/ utf8mb3]列中没有任何补充字符,并且在升级旧版本的utf8 [/ utf8mb3]数据时无需担心转换字符或丢失数据MySQL的。

因此,如果您希望列支持存储位于BMP之外的字符(通常是您想要的),例如表情符号,请使用“utf8mb4”。另请参见实际使用中最常见的非BMP Unicode字符是什么?


查看完整回答
反对 回复 2019-07-23
?
富国沪深

TA贡献1790条经验 获得超9个赞

utf8mb4,因为现在我们需要为存储不仅语言文字,而且是符号,新引进的表情符号,支持,等等字符集是非常有用的。

如何在 Mathias Bynens中支持MySQL数据库中完整Unicode,这也很好地解读了这一点


查看完整回答
反对 回复 2019-07-23
?
慕姐4208626

TA贡献1852条经验 获得超7个赞

摘自MySQL 8.0参考手册

  • utf8mb4Unicode字符集的UTF-8编码,每个字符使用一到四个字节

  • utf8mb3Unicode字符集的UTF-8编码,每个字符使用一到三个字节

MySQL的 utf8是目前的别名utf8mb3,其已被弃用,并且将在未来被删除的MySQL版本。届时utf8 将成为参考 utf8mb4

因此,无论这个别名如何,您都可以有意识地为自己设置utf8mb4编码。


查看完整回答
反对 回复 2019-07-23
  • 3 回答
  • 0 关注
  • 2234 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号