当前位置：文江博客话题详情

XML 文档（XQuery？）与 MySQL 的搜索相关性

发布于 2024-08-28 14:37:22 字数 271 浏览 14 评论 0原文

我有一个网站，其中文档保存在 xml 文档中，所有文档都具有相同的结构。

我需要一个搜索引擎，可以根据搜索用户给出的关键词选择相关性最高的文档。

我认为使用 XQuery 可能是一个好主意，而不是将信息存储两次（在 XML 文档 + mysql 数据库中）并查询 mysql 数据库以进行相关性搜索。

XQuery 对此有什么好处吗？对于超过 1000 个文档（每个文档大约 7kb），我期望什么效果以及速度如何。

谢谢您的宝贵时间。

亲切的问候

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

静赏你的温柔 2024-09-04 14:37:22

如果您有超过 1000 个文档正在根据查询进行搜索，那么使用 jQuery 或 SQL 数据库效率不高。

1) 对每个文档中的每个关键字进行顺序搜索将需要不少于文档数 * 每个文档中的单词数 * 关键字数

2) 每次进行搜索时，每个文档都必须重新扫描。如果你的项目涉及多次搜索，这是不可行的。

3) 顺序搜索无法根据找到的单词数量、文档中的单词总数以及每个单词的重要性等对结果进行排名...

更好的替代方法是使用倒排索引数据结构可提前“索引”您的文档和单词。

这样，您将预先做一些工作来为每个文档中的每个单词建立索引，但是在进行实际搜索时您将节省大量时间（这才是最重要的）。

另一个优点是您将能够以非临时方式对文档进行排名。请参阅向量空间模型。

回复收藏 0 原文

痞味浪人 2024-09-04 14:37:22

如果您想要 XML 文档的搜索解决方案（仅搜索而不是复杂的文档事务）那么我建议 Apache - Lucene 搜索引擎。

最新的 Apache Lucene 3.x 版本提供了下降搜索功能。

最重要的是，您可以使用 Apache-Solr，它使用 lucene 作为搜索引擎，具有所有管理功能、分面浏览和有效负载。
（注意：Lucene 实现也适用于所有 .NET、Java、Python、Ruby 语言）。

如果您想要一些真正基于 XQuery 且具有开源性质的解决方案 - 考虑到您的文档量，请尝试 eXist Xml 数据库。加载 eXists 数据库中的所有 Xml 文档，然后使用 XQuery。但这种方法需要 -

将所有 Xml 文档提取到 eXists 数据库中
编写 XQuery 模块以将这些文档查询到 Xml 结果集中
直接从您的应用程序与这些 XQuery 模块对话以获取结果。

回复收藏 0 原文

~没有更多了~

关于作者

夜深人未静

暂无简介

0 文章

0 评论

24 人气

关注发私信

初遇

文章 0 评论 0

关注

听闻余生

文章 0 评论 0

关注

Z_dy

文章 0 评论 0

关注

左岸枫

文章 0 评论 0

关注

1848719402

文章 0 评论 0

关注

婷

文章 0 评论 0

友情链接

文江博客

XML 文档（XQuery？）与 MySQL 的搜索相关性

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

初遇

听闻余生

Z_dy

左岸枫

1848719402

婷

友情链接

XML 文档（XQuery？）与 MySQL 的搜索相关性

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

初遇

听闻余生

Z_dy

左岸枫

1848719402

婷

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。