当前位置：文江博客话题详情

lucene中数据是如何存储的

发布于 2025-01-01 10:51:12 字数 84 浏览 2 评论 0原文

我知道lucene创建一个索引并存储所有数据。任何人都可以告诉我数据如何存储在平面文件中吗？或者他们使用什么样的算法将数据存储在后端以便他们可以快速检索？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

撧情箌佬 2025-01-08 10:51:12

不知道这是否是您所要求的。但更普遍的答案是他们使用/实现倒排索引。 Lucene 如何存储它的具体信息可以在文件格式中找到（正如 milan 所说））。

但总体思路是，它们存储倒排索引数据结构和其他辅助数据结构，以帮助快速回答查询。例如，它存储每个文档和每个术语的 IDF 的规范向量（逆文档频率）。 Lucene 还存储实际的文档字段，但它位于倒排索引之外。

回复收藏 0 原文

谢绝鈎搭 2025-01-08 10:51:12

您可以在文件格式部分找到所有解释。

回复收藏 0 原文

就像说晚安 2025-01-08 10:51:12

您可以阅读这本书 http://nlp.stanford.edu/IR-book/了解信息检索系统中使用的数据结构、算法和模型

回复收藏 0 原文

~没有更多了~

关于作者

薆情海

暂无简介

文章

28 人气

关注发私信

alipaysp_snBf0MSZIv

文章 0 评论 0

关注

梦断已成空

文章 0 评论 0

关注

瞎闹

文章 0 评论 0

关注

凯凯我们等你回来

文章 0 评论 0

关注

寄意

文章 0 评论 0

关注

似梦非梦

文章 0 评论 0

友情链接

文江博客

lucene中数据是如何存储的

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（3）

关于作者

相关话题

热门标签