当前位置：文江博客话题详情

CouchDB - 每组的前 N 个文档

发布于 2024-12-06 05:42:15 字数 604 浏览 1 评论 0原文

我目前正在通过我们在 Web 项目中遇到的几个常见用例来评估 CouchDB。

这些用例之一如下：

考虑一个包含（人为示例）的系统：

文章
问题
主题

文章和问题可以分配给多个主题。

主题有自己的页面（想想 http://www.quora.com 主题）。

是否可以通过 couchdb 的 1 个查询同时获取：

有关主题 X 的最新 N 篇文章
和有关主题 X 的最新 N（或 M？）问题

更通用的术语：我正在寻找一种按类型进行分组的方法（在本例中， type = 'article' 或 'question' ）并且对于每个组，返回前 n 个文档，给定特定的排序（在本例中排序是按时间倒序排列），并限制于特定的过滤器（在本例中为主题） 'X'）

从我读到的内容来看，从性能的角度来看，并行执行多个 couchdb 查询通常没什么大不了的，但我只是好奇这个（对于我们经常使用的）用例是否可以在一个单个请求。

感谢您的任何见解

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

夜还是长夜 2024-12-13 05:42:15

不会。CouchDB

视图是一维的。对于给定主题，最新的文章和最新的问题是二维查询，因此不可能在一个 HTTP 请求中实现。

关于解决方法的思考

CouchDB 是为并发查询而设计的，并鼓励并发查询。在生产中，我会同时根据其他答案进行两个查询。（在 Javascript 中，这非常简单，但任何异步或线程编程语言都可以做到。）

接收两个结果的响应时间将只是较长结果的响应时间（即，首先完成的是“免费”）。您甚至可以遍历两个响应的行，以 O(1) 空间和 O(n) 时间合并它们的时间线 - 还不错！

CouchDB 唯一不保证的是两个查询代表完全相同的数据库状态的快照。您提到了 Quora，这是现代数据库需求的完美示例。 理论上，您不知道这两个查询之间数据库状态发生了多少变化。一般来说，你不知道一种观点与另一种观点相比是否有意义。 在实践中，答案是显而易见的：谁在乎？实际上，仅以毫秒为间隔的查询在一起就非常有意义。这就是为什么 CouchDB 非常适合 Web 应用程序，尽管其功能集受到严格限制。

替代解决方案：GeoCouch

GeoCouch 扩展实际上是一个通用的二维边界框查询引擎。此外，显然，地理空间数据还可以用于查询存储为 timestamp x severity 2-space 的日志。然而，它目前仍然是一个独立于 CouchDB 的项目，所以我不愿意将其称为“CouchDB 查询”。

回复收藏 0 原文

安穩 2024-12-13 05:42:15

可以通过 CouchDB 的 1 个查询来获取两者。两个查询都使用映射/归约查询，尽管您不需要归约函数。

您需要视图行具有 [$type, $topic, $timestamp] 对作为键：

["article" , "money", "2011-09-21T20:50:29.819Z"]
["article" , "shoes", "2011-09-21T20:30:29.819Z"]
["article" , "shoes", "2011-09-21T20:50:29.819Z"]
["question", "grits", "2011-01-13T20:30:18.123Z"]
["question", "money", "2011-09-20T20:30:18.123Z"]

此函数可能会这样做：

function(doc) {
    // _design/my_app/_view/topic_parts
    var key;

    if(doc.type && doc.parent_topic && doc.created_at) {
        // Looks good, emit it into the view.
        key = [doc.type, doc.parent_topic, doc.created_at];
        emit(key, doc);
    }
}

要查找最新的 N 行（无论是文章还是问题），您基本上需要按降序匹配 [$type, $topic, *] 的行。例如，对于主题X的最新N篇文章，可以这样分解。（请注意，null 是 CouchDB 中的最小值，对象 {} 是最大的值。）

descending=true 获取逆时间顺序。（注意“降序”在概念上意味着沙发从行的“底部”到“顶部”扫描。因此 startkey 和 endkey 是相反的。）
startkey=["articles"," X",{}]，所以这是从时间结束时开始关于X的文章
endkey=["articles","X" ,null]，这是关于X的相同文章以时间
limit=N开始结尾，以减少结果

查询因此看起来像这样（记住如有必要，对 URL 进行编码）。

GET /db/_design/my_app/_view/topic_parts?descending=true&startkey=["articles","X",{}]&endkey=["articles","X",null]&limit=N

It is possible with 1 query from CouchDB to get both. Both queries use a map/reduce query, although you do not need the reduce function.

You need the view rows to have [$type, $topic, $timestamp] pairs for keys:

["article" , "money", "2011-09-21T20:50:29.819Z"]
["article" , "shoes", "2011-09-21T20:30:29.819Z"]
["article" , "shoes", "2011-09-21T20:50:29.819Z"]
["question", "grits", "2011-01-13T20:30:18.123Z"]
["question", "money", "2011-09-20T20:30:18.123Z"]

This function might do that:

function(doc) {
    // _design/my_app/_view/topic_parts
    var key;

    if(doc.type && doc.parent_topic && doc.created_at) {
        // Looks good, emit it into the view.
        key = [doc.type, doc.parent_topic, doc.created_at];
        emit(key, doc);
    }
}

To find the latest N rows (whether articles or questions), you basically need rows matching [$type, $topic, *] in descending order. For example, for the latest N articles on topic X, that breaks down like this. (Note that null is the smallest value in CouchDB and the object {} is the largest.)

descending=true to get reverse chronological order. (Note "descending" conceptually means couch is scanning from the "bottom" to the "top" of the rows. So startkey and endkey are reversed.)
startkey=["articles","X",{}], so this is articles about X starting from the end of time
endkey=["articles","X",null], this is the same articles about X ending with the beginning of time
limit=N, to trim the results down

The query would thus look like this (remember to encode the URL if necessary).

GET /db/_design/my_app/_view/topic_parts?descending=true&startkey=["articles","X",{}]&endkey=["articles","X",null]&limit=N

回复收藏 0 原文

~没有更多了~

关于作者

似最初

暂无简介

0 文章

0 评论

25 人气

关注发私信

友情链接

文江博客

CouchDB - 每组的前 N 个文档

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于解决方法的思考

替代解决方案：GeoCouch

Thoughts on a workaround

Alternative solution: GeoCouch

关于作者

相关话题

热门标签

推荐作者

已经忘了多久

15867725375

LonelySnow

走过海棠暮

轻许诺言

信馬由缰

友情链接

CouchDB - 每组的前 N ​​个文档

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于解决方法的思考

替代解决方案：GeoCouch

Thoughts on a workaround

Alternative solution: GeoCouch

关于作者

相关话题

热门标签

推荐作者

已经忘了多久

15867725375

LonelySnow

走过海棠暮

轻许诺言

信馬由缰

友情链接

CouchDB - 每组的前 N 个文档

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。