信息检索数据库格式?
我正在寻找一些有关信息检索系统(例如 Lucene)如何存储索引以进行快速“相关性”查找的文档。我的 Google-fu 失败了:我找到了一个描述 Lucene 文件格式的页面,但它更关注每个数字有多少位,而不是如何使用数据库来生成快速查询。
当然有人有一些有用的书签可以推荐给我。
谢谢!
I'm looking for some documentation on how Information Retrieval systems (e.g., Lucene) store their indexes for speedy "relevancy" lookups. My Google-fu is failing me: I've found a page which describes Lucene's file format, but it's more focused on how many bits each number is than on how the database is used in producing speedy queries.
Surely someone has some useful bookmarks lying around that they can refer me to.
Thanks!
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
Lucene 索引是倒排索引,因此有关此主题的任何搜索都应该是相关的,例如:
The Lucene index is an inverted index, so any search on this topic should be relevant, like: