3 回答
TA贡献2003条经验 获得超2个赞
A 字符集
是一组符号和编码。一个 校对用于比较字符集中字符的一组规则。让我们用一个假想字符集的例子来明确区分。
假设我们有一个有四个字母的字母表:‘a’,‘B’,‘a’,‘b’。我们给每个字母一个数字:‘a’=0,‘B’=1,‘a’=2,‘b’=3。字母‘A’是一个符号,数字0是‘A’的编码,所有四个字母及其编码的组合是一个字符集。
现在,假设我们要比较两个字符串值,‘A’和‘B’。最简单的方法是查看编码:0表示‘A’,1表示‘B’。因为0小于1,所以我们说‘A’小于‘B’。现在,我们所做的就是对我们的字符集应用一个排序规则。排序规则是一组规则(在本例中只有一条规则):“比较编码”。我们将这种最简单的排序称为二进制排序。
但是如果我们想说小写字母和大写字母是等价的呢?然后我们至少有两条规则:(1)把小写字母‘a’和‘b’当作相当于‘A’和‘B’的字母;(2)然后比较编码。我们称之为不分案件的校对。它比二进制排序要复杂一些。
在现实生活中,大多数字符集都有许多字符:不仅仅是‘A’和‘B’,而是整个字母,有时是多个字母或数千个字符的东方书写系统,还有许多特殊的符号和标点符号。在现实生活中,大多数校对都有很多规则:不只是大小写不敏感,而且重音不敏感(“重音”是一个标记附在一个字符上,就像德语中的‘?’)和多字符映射(比如两个德语校勘中‘OE’=‘OE’的规则)。
TA贡献2019条经验 获得超9个赞
添加回答
举报