我正在尝试研究 fuzzywuzzy 如何计算这个简单的模糊比率:print(fuzz.ratio("66155347", "12026599"))
25为什么模糊率不为 0,因为它们在每个位置都是完全不同的字符?编辑距离 = 8(因为每个值都需要被替换) a 为 8(字符串 1 的长度为 8) b 为 8(字符串 2 的长度为 8)fuzz.ratio 为 (a+b - 编辑距离)/(a+b)模糊比率为 (8+8 - 8)/(8+8) = .50模糊比率为 50我的数学也一定有问题;我快50了模糊率是如何达到 25 的?任何指导将不胜感激。
1 回答
![?](http://img1.sycdn.imooc.com/5333a1bc00014e8302000200-100-100.jpg)
素胚勾勒不出你
TA贡献1827条经验 获得超9个赞
fuzzywuzzy 库使用 Levenshtein 距离的加权版本,为替换赋予权重 2,从而使 Levenshtein 距离达到 12。则 (8 + 8 - 12) / (8 + 8) = 0.25。
添加回答
举报
0/150
提交
取消