当前位置：文江博客话题详情

如何在给定一个输入单词的情况下生成发音相似的单词列表？

发布于 2025-01-01 12:05:34 字数 308 浏览 7 评论 0原文

当您在 Google 中拼错一个单词（例如“apples”）时，它会为您提供现在熟悉的“您的意思是：apples”建议。

排除谷歌根据搜索结果的相关性猜测你的意图的能力，我怎样才能开发出听起来相同的单词列表？

这些词不一定是英语，也不一定存在。因此，例如，如果我输入“hole”，我会得到一个包含以下单词的列表：“whole”“hola”“whore”“role”“molar”等...

我猜可能有网上有一些可以制定此列表的东西，但我找不到任何东西。如果没有站点并且可以使用 Perl 完成，是否有 CPAN 模块可以帮助我做到这一点？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

似狗非友 2025-01-08 12:05:34

如果您确实正在寻找听起来相同的单词，而不仅仅是搜索建议 - 您可以查看语音算法。 Soundex 和 Metaphone/Double Metaphone 是两个非常常见的，并且每个流行语言都有实现。

这些算法将单词简化为指示其发音的“键”。如果您从一个单词语料库开始并构建一个数据结构，将这些键映射到评估它们的单词 - 您可以采用任意字符串，将其评估为它的“键”，然后查找评估为相同值的其他单词数据结构中的键（可能是列表的哈希表或类似的）。

这并不完美，因为您需要找到一个大的单词语料库来为数据集播种，但它可以工作。

另一方面，如果您只是想要搜索建议/替代拼写，则有更简单的方法可以实现。

希望这有帮助。

回复收藏 0 原文

假面具 2025-01-08 12:05:34

您可以从了解模块 Text::Soundex 开始。这是一个将单词映射到 4 字节代码的简单算法。我很久以前就从 Sedgewick（前 Knuth）那里得到了 Soundex，用它来生成更长的密钥（未截断）并建议了 0 和 1 字母替换的更正列表。我将其应用于人口普查和邮政数据的大型数据库。

回复收藏 0 原文

~没有更多了~

关于作者

无敌元气妹

暂无简介

文章

27 人气

关注发私信

友情链接

文江博客

如何在给定一个输入单词的情况下生成发音相似的单词列表？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

佚名

今天

゛时过境迁

达拉崩吧

呆萌少年

孤者何惧

友情链接

如何在给定一个输入单词的情况下生成发音相似的单词列表？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

佚名

今天

゛时过境迁

达拉崩吧

呆萌少年

孤者何惧

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。