如何计算一个字符串在定义的字符串范围内的距离？

发布于 2025-01-11 11:42:09 字数 489 浏览 0 评论 0原文

给定一个由两个字符串 [x, y] 和它们之间的第三个字符串 s 定义的区间，有没有办法计算从 x 到 s 的整个区间的百分比。最好遵循排序规则（例如，大小写重要与否）。一个大概的答案是合理的。

例如，在正常的 Latin-1 排序规则中，给定字符串“a”和“c”，“b”位于中间，因此我们预计答案为 50%。

显而易见但错误的方法就是相信编码会占上风。不幸的是，忽略了这样一个事实：在不区分大小写的排序规则中，'B' 位于区间 ['a', 'c'] 中，并且等同于 'b'，即使 'B' 被编码为比 ' 更高的数字c'。因此，编码没有这些信息，除非我们进行一些标准化，这可能会很昂贵。

我希望有人想到更好的方法。这似乎应该在数据库实现中经常出现，但我没有在文献或网上看到任何暗示这一点的内容。公平地说，我完全有可能在错误的地方和错误的名字下查找。字符串距离问题似乎主要由编辑距离主导，而不是这种与排序规则相关的距离。

除了排序规则之外，问题也可能取决于编码。在这种情况下，我最感兴趣的是各种 UTF 编码。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

列表为空，暂无数据

关于作者

暖伴

暂无简介

文章

26 人气

关注发私信

友情链接

文江博客

如何计算一个字符串在定义的字符串范围内的距离？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

关于作者

相关话题

热门标签

推荐作者

微信用户

小情绪

追我者格杀勿论

ゞ记忆︶ㄣ

笨死的猪

彭明超

友情链接

如何计算一个字符串在定义的字符串范围内的距离？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

关于作者

相关话题

热门标签

推荐作者

微信用户

小情绪

追我者格杀勿论

ゞ记忆︶ㄣ

笨死的猪

彭明超

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。