当前位置：文江博客话题详情

Lucene 或 Mysql 全文搜索

发布于 2024-11-26 09:41:08 字数 1432 浏览 2 评论 0原文

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

穿越时光隧道 2024-12-03 09:41:08

我在 2010 年 11 月也做出了同样的决定。我是 mysql 的朋友，并尝试首先在 mysql 上构建一个搜索应用程序 - 效果很好......
...而且快速（我认为它很快）：搜索 200.000 个文档（不超过 2-3 秒）

我避免花时间在 lucene/solr 上，因为我想利用这段时间来开发应用程序。而且：lucene 对我来说是新的......我不知道，如果它足够好，我不知道它是什么......
最后：你无法改变一生的习惯。

然而，我遇到了模糊搜索（这在 mysql 中很难实现）或“更像这样”（必须使用 mysql 在应用程序中从 scrat 进行编码或简单使用“更像这样”solr-feature）遇到不同的问题开箱即用）。
最后，文档数量增加到一百万，mysql 现在需要超过 15 秒来搜索文档。

所以我决定从lucene开始，感觉就像我打开了一扇新世界的大门。
现在 solr 提供了很多功能（我几乎没有编码应用程序功能）并且开箱即用。全文搜索要快得多：100 万个文档的搜索时间不到 50 毫秒，如果缓存的话则不到 1 毫秒。

所以投入的时间得到了回报。

因此，如果您想要进行全文搜索：如果您有多个数据，请使用 lucene。
顺便说一句：我正在使用混合结构：将数据保存在 mysql 和 lucene 中只是一个索引，（几乎）没有存储数据（以保持该索引小而快）。

回复收藏 0 原文

笔落惊风雨 2024-12-03 09:41:08

一般来说，如果你要进行全文搜索，你肯定需要 lucene 或 sphinx + mysql （或 lucene + mysql，将可索引字段存储在 lucene 中，并返回 mysql 行的 id）。它们都是很好的选择。

如果您打算进行“普通”搜索（即：整数或字符列或日期），mysql 分区就足够了。

您需要指定要搜索的内容。以及您将多久重新索引一次数据库（如果您要经常重新索引，我会选择 sphinx）

回复收藏 0 原文

贱贱哒 2024-12-03 09:41:08

你问的是使用 Lucene 还是 MySQL。但Lucene是一个库，而MySQL是一个服务器。您确实应该在 SOLR 搜索引擎和 MySQL 之间做出选择。在这种情况下，正确的答案很可能是两者兼而有之。管理MySQL中的所有数据。运行流程定期提取更改的数据，将其转换为 SOLR 搜索格式，并将其加载到搜索引擎中。使用 SOLR 比直接使用 Lucene 简单得多，如果您需要以某种方式修改行为，您仍然可以为 SOLR 编写插件，因此不会损失灵活性。

但尝试使用 SOLR 管理数据将是死亡之吻。读取-编辑-更新的循环非常适合 SQL 数据库，但这并不是 SOLR 的全部内容。 SOLR 是快速灵活的文本搜索。您可以将图像 URL 粘贴到 SOLR 中，以便使用非索引字段准备搜索结果。

回复收藏 0 原文

~没有更多了~

关于作者

双手揣兜

暂无简介

0 文章

0 评论

22 人气

关注发私信

友情链接

文江博客

Lucene 或 Mysql 全文搜索

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（3）

关于作者

相关话题

热门标签

推荐作者

书间行客

我ぃ本無心為│何有愛

神妖

undefined

38169838

彡翼

友情链接

Lucene 或 Mysql 全文搜索

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（3）

关于作者

相关话题

热门标签

推荐作者

书间行客

我ぃ本無心為│何有愛

神妖

undefined

38169838

彡翼

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。