Solr/SolrJ：如何在不创建巨大 ArrayList 的情况下迭代结果

发布于 2024-10-18 07:46:49 字数 843 浏览 0 评论 0原文

有没有一种方法可以迭代 Solrj 响应，以便在迭代期间增量获取结果，而不是返回巨大的内存中 ArrayList？

或者我们是否必须诉诸于此：

    SolrQuery query = new SolrQuery();
    query.setQuery("*:*");
    int fetchSize = 1000;
    query.setRows(fetchSize);
    QueryResponse rsp = server.query(query);

    long offset = 0;
    long totalResults = rsp.getResults().getNumFound();

    while (offset < totalResults)
    {
        query.setStart((int) offset);  // requires an int? wtf?
        query.setRows(fetchSize);

        for (SolrDocument doc : server.query(query).getResults())
        {
             log.info((String) doc.getFieldValue("title"));
        }

        offset += fetchSize;
    }

当我谈论这个主题时，为什么 SolrQuery.setStart() 需要一个 integer，当 SolrDocumentList.getStart ()/getNumFound() 返回long？

原文

Is there a way to iterate over a Solrj response such that the results are fetched incrementally during iteration, rather than returning a giant in-memory ArrayList?

Or do we have to resort to this:

    SolrQuery query = new SolrQuery();
    query.setQuery("*:*");
    int fetchSize = 1000;
    query.setRows(fetchSize);
    QueryResponse rsp = server.query(query);

    long offset = 0;
    long totalResults = rsp.getResults().getNumFound();

    while (offset < totalResults)
    {
        query.setStart((int) offset);  // requires an int? wtf?
        query.setRows(fetchSize);

        for (SolrDocument doc : server.query(query).getResults())
        {
             log.info((String) doc.getFieldValue("title"));
        }

        offset += fetchSize;
    }

And while I'm on the topic, why does SolrQuery.setStart() require an integer, when SolrDocumentList.getStart()/getNumFound() return long?

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

不弃不离 2024-10-25 07:46:50

Caffeine 的原因是 Solr 旨在为您提供前 X 个搜索结果。期望您将返回一个“合理”的数字。如果 Solr 必须深入查看搜索结果（数千个），那么您就违背了 Solr 的设计目的。它会起作用，但查询响应将呈指数级减慢，并且您必须深入搜索结果越慢。
Solr 中正在进行一些工作来提高此用例的效率，但我最近没有看到任何进展。

回复收藏 0 原文