当前位置：文江博客话题详情

在 Solr 中更新易失性数据有哪些策略？

发布于 2024-12-06 12:52:46 字数 238 浏览 2 评论 0原文

在 Solr 中更新易失性数据有哪些策略？想象一下，如果您需要在 Solr 索引中对 YouTube 视频数据进行建模：如何在不使 Solr 淹没在更新中的情况下保持“观看次数”数据最新？

我认为将“视图”数据存储在更擅长处理快速更新的不同数据存储（例如 MongoDB 或 Redis）中将是最好的主意。

但是使用该数据定期更新索引的最佳方法是什么？在这种情况下，增量导入有意义吗？增量导入对 Solr 运行查询的性能有何影响？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

鹿童谣 2024-12-13 12:52:46

首先你需要定义“新鲜”。

“新鲜”是1ms吗？如果是这样，当值（渲染的 html）到达浏览器时，由于网络延迟，它已经不再新鲜了。这真的重要吗？对于绝大多数情况，不需要真正的实时结果。

更常见的限制是 1 秒。在这种情况下，Solr 可以使用 RankingAlgorithm （插件）或软提交（目前仅在 Solr 4.0 主干中可用）。

“Delta-import”是 DataImportHandler 中的一个术语，没有太多内在含义。从 Solr 服务器的角度来看，只有文档添加，它们来自哪里或一组文档是否代表“整个”数据集并不重要。

如果您希望某个项目在其创建/修改后 1 秒内建立索引，那么就这样做，在创建/修改后立即将其添加到 Solr（例如在 DAL 中使用挂钩）。这应该异步完成，并使用 RA 或软提交。

回复收藏 0 原文

酒中人 2024-12-13 12:52:46

您可能对所谓的“近实时搜索”（NRT）感兴趣，它现在可以在 Solr 的主干上使用，它的设计正是为了解决这个问题。请参阅 http://wiki.apache.org/solr/NearRealtimeSearch 了解更多信息和链接。

回复收藏 0 原文

筱果果 2024-12-13 12:52:46

使用外部文件字段怎么样？
这有助于您在单独的文件中维护索引之外的数据，您可以定期刷新该文件，而无需对索引进行任何更改。

对于下载量、浏览量、排名等快速变化的数据，这可能是一个不错的选择。
更多信息@ http://lucene.apache.org/ solr/api/org/apache/solr/schema/ExternalFileField.html

这有一些限制，因此您需要根据您的需要进行检查。

回复收藏 0 原文

~没有更多了~

关于作者

等待圉鍢

暂无简介

文章

25 人气

关注发私信

tomoekana

文章 0 评论 0

关注

无边思念无边月

文章 0 评论 0

关注

眼角的笑意。

文章 0 评论 0

关注

在风中等你

文章 0 评论 0

关注

是你

文章 0 评论 0

关注

syong71

文章 0 评论 0

友情链接

文江博客

在 Solr 中更新易失性数据有哪些策略？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（3）

关于作者

相关话题

热门标签