3 回答
TA贡献1883条经验 获得超3个赞
比较Swift字符串<与会根据所谓的“ Unicode规范化形式D”(可以通过计算 decomposedStringWithCanonicalMapping)进行词典上的比较
例如,分解
"ä" = U+00E4 = LATIN SMALL LETTER A WITH DIAERESIS
是两个Unicode代码点的序列
U+0061,U+0308 = LATIN SMALL LETTER A + COMBINING DIAERESIS
出于演示目的,我编写了一个小的String扩展名,该扩展名将String的内容转储为Unicode代码点的数组:
extension String {
var unicodeData : String {
return self.unicodeScalars.map {
String(format: "%04X", $0.value)
}.joined(separator: ",")
}
}
现在,让我们来一些字符串,用<:
let someStrings = ["ǟψ", "äψ", "ǟx", "äx"].sorted()
print(someStrings)
// ["a", "ã", "ă", "ä", "ǟ", "b"]
并将每个字符串(原始和分解形式)的Unicode代码点转储到排序数组中:
for str in someStrings {
print("\(str) \(str.unicodeData) \(str.decomposedStringWithCanonicalMapping.unicodeData)")
}
输出
äx 00E4,0078 0061,0308,0078
ǟx 01DF,0078 0061,0308,0304,0078
ǟψ 01DF,03C8 0061,0308,0304,03C8
äψ 00E4,03C8 0061,0308,03C8
很好地显示了比较是通过分解形式的Unicode代码点的字典顺序进行的。
如以下示例所示,对于多个字符的字符串也是如此。用
let someStrings = ["ǟψ", "äψ", "ǟx", "äx"].sorted()
以上循环的输出是
äx 00E4,0078 0061,0308,0078
ǟx 01DF,0078 0061,0308,0304,0078
ǟψ 01DF,03C8 0061,0308,0304,03C8
äψ 00E4,03C8 0061,0308,03C8
意思就是
"äx" < "ǟx", but "äψ" > "ǟψ"
(这至少对我来说是出乎意料的)。
最后,让我们将其与语言环境敏感的顺序进行比较,例如瑞典语:
let locale = Locale(identifier: "sv") // svenska
var someStrings = ["ǟ", "ä", "ã", "a", "ă", "b"]
someStrings.sort {
$0.compare($1, locale: locale) == .orderedAscending
}
print(someStrings)
// ["a", "ă", "ã", "b", "ä", "ǟ"]
如您所见,结果与Swift <排序不同。
TA贡献1834条经验 获得超8个赞
词典顺序和区分区域的顺序可以不同。您可以在以下问题中看到它的一个示例:在 不更改C#顺序的情况下,对等价于C#的scala列表进行排序
在这种特定情况下,对语言环境敏感的顺序位于_之前1,而在字典顺序中则相反。
快速比较使用字典顺序。
- 3 回答
- 0 关注
- 559 浏览
添加回答
举报