当前位置：文江博客话题详情

Django indexing full-text-indexing django-haystack

django-haystack：选择较大的 SearchIndex 而不是索引数据库

发布于 2024-11-02 00:39:30 字数 710 浏览 10 评论 0原文

我有一个包含 35 个字段的 UserProfile 模型（Char、Int、Bool、Dec、M2M、FK）。作为搜索视图功能的一部分，其中一个字段需要全文搜索，而其余 34 个字段将用于提供“高级搜索过滤”（使用：__gte、__lte、__exact、__in、__startswith）。 “搜索”查询可以使用 5-35 个字段作为搜索视图条件。

我正在使用 haystack 构建 SearchIndex，目前已添加所有 35 个字段，但这似乎无效，因为我绕过了 django ORM（？）。

Filter Django Haystack results like QuerySet? 的答案表明我可以将单个全文搜索字段存储在 SearchIndex 中，并将 SearchQuerySet 与 django 的 QuerySet 组合起来以获取剩余的 34 个过滤字段。然后我会在 django 模型中的部分或全部这些字段上使用 db_index=True 吗？使用这种两阶段查询合并方法是否可以很好地扩展到数千个结果？

由于我的 UserProfile 模型可能会增长到 300K-2M 条目，因此我试图了解如何最好地索引该模型。作为数据库索引和搜索的新手，我正在寻找有关如何最好地优化数据库的任何见解。

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（1）

韵柒 2024-11-09 00:39:30

混合两者可能无法扩展。当您构建查询集或 SearchQuerySet 时，查询实际上不会运行，直到您在某处请求结果为止，因此从这个意义上说它们是懒惰的。

但是，如果您执行类似

results = [ r.pk for r in searchqueryset ] 的

操作，它实际上会针对 haystack/solr 执行该查询。如果您总共查看 200 万个条目，这意味着您的列表可能会返回 200 万个项目。现在您将一个 2M 列表发送到 MySQL（使用 ORM）进行进一步过滤。这显然永远不会扩大规模。

如果你只是坚持使用 haystack 然后继续构建你的搜索查询集，它只会在访问结果时执行一次。还要记住减少 {{ result.object }}，因为这也会影响每个结果的数据库。

你可以看看 load_all()、faceting 等。

回复收藏 0 原文

~没有更多了~

关于作者

暂无简介

文章

评论

26 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

lylex099819

文章 0 评论 0

yg

文章 0 评论 0

mb_PT8LkUS5

文章 0 评论 0

埋情葬爱

文章 0 评论 0

佚名

文章 0 评论 0

奢望

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文