找到与关键字给定的相似字符串，每个关键字都有自己的“力量”；

发布于 2024-10-26 22:18:16 字数 868 浏览 12 评论 0原文

这个问题对我来说是一个挑战，我的朋友不能告诉我该怎么做，但他真的是很好的程序员（我认为）。

用户可以将句子存入数据库。当用户放置一个句子时，它会保存在sentences表中。接下来，句子被分割成单词，单词的每个 soundex 被保存到带有分割句子 id 的表 tags 中。

最后，将单词的每个 soundex 放入 weights 表中，如果存在相同的 soundex，则函数将该 soundex 的 counter 加 1。

（对于那些不知道的人：soundex 是一个返回字符串的语音表示（发音方式）的函数）

数据库的结构：一张表 sentences 包含两行：id 和 sentence。其他表tags包含id（with是句子的id）和tag（with是句子中的一个单词）。 tag 实际上不仅仅是简单的单词，而是这个单词的发音。最后一个表weights包含tag和weight（带有数字，它告诉我们表tags<中有多少个这样的标签） /code>）

我的问题是：如何使函数返回给定字符串的相似句子。它应该使用标签（单词的 soundex），并且每个标签应该基于权重表拥有自己的权力。经常使用的标签比更原始的标签更重要。可以只用一个mysql查询来完成吗？

下一个问题：我认为这种寻找相似句子的方式很好，但是这个函数的速度怎么样？我需要在我的网站中非常非常频繁地使用它。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

若沐 2024-11-02 22:18:16

那么为什么没有一个权重表，而是一个将标签与句子相关联的表呢？因此，有一个名为 sentence_tags 的表，其中包含 sentence_id 和 tag_id 列。然后，您可以通过对这两个表进行联接来计算权重，并且仍然引用包含该标签的句子。您也可以在使用时将标签和 soundex 都存储在标签表中。

回复收藏 0 原文