如何使用 pycassa 获取存储在 Cassandra 列族中的所有键？

发布于 2024-08-24 16:14:34 字数 350 浏览 11 评论 0原文

有没有人有使用 pycassa 的经验，我对此表示怀疑。如何获取数据库中存储的所有密钥？

在这个小片段中，我们需要提供键才能获取关联的列（这里的键是“foo”和“bar”），这很好，但我的要求是一次获取所有键（仅键）作为 Python 列表或类似的数据结构。

cf.multiget(['foo', 'bar'])
{'foo': {'column1': 'val2'}, 'bar': {'column1': 'val3', 'column2': 'val4'}}

谢谢。

原文

Is anyone having experience working with pycassa I have a doubt with it. How do I get all the keys that are stored in the database?

well in this small snippet we need to give the keys in order to get the associated columns (here the keys are 'foo' and 'bar'),that is fine but my requirement is to get all the keys (only keys) at once as Python list or similar data structure.

cf.multiget(['foo', 'bar'])
{'foo': {'column1': 'val2'}, 'bar': {'column1': 'val3', 'column2': 'val4'}}

Thanks.

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

温柔戏命师 2024-08-31 16:14:34

尝试：

    list(cf.get_range().get_keys())

这里有更多好东西：http://github.com/vomjom/pycassa

try:

    list(cf.get_range().get_keys())

more good stuff here: http://github.com/vomjom/pycassa

回复收藏 0 原文

心奴独伤 2024-08-31 16:14:34

您可以尝试：cf.get_range(column_count=0,filter_empty=False)。

# Since get_range() returns a generator - print only the keys.
for value in cf.get_range(column_count=0,filter_empty=False):
    print value[0]

You can try: cf.get_range(column_count=0,filter_empty=False).

# Since get_range() returns a generator - print only the keys.
for value in cf.get_range(column_count=0,filter_empty=False):
    print value[0]

回复收藏 0 原文

热风软妹 2024-08-31 16:14:34

get_range([开始][, 结束][, 列][, 列开始][, 列完成][, 列反转][, 列计数][, 行计数][, 包含时间戳][, 超级列][, 读取一致性级别][,缓冲区大小]）

获取a中行的迭代器
指定的键范围。

http://pycassa.github.com/pycassa /api/pycassa/columnfamily.html#pycassa.columnfamily.ColumnFamily.get_range

回复收藏 0 原文

风蛊 2024-08-31 16:14:34

Santhosh 解决方案的小改进

dict(cf.get_range(column_count=0,filter_empty=False)).keys()

如果您关心顺序：

OrderedDict(cf.get_range(column_count=0,filter_empty=False)).keys()

get_range 返回一个生成器。我们可以从生成器创建一个字典并从中获取密钥。

column_count=0 将结果限制为 row_key。但是，由于这些结果没有列，我们还需要 filter_empty。

filter_empty=False 将允许我们得到结果。然而，空行和范围幻影现在可能包含在我们的结果中。

如果我们不介意更多的开销，只获取第一列将解决空行和范围幽灵问题。

dict(cf.get_range(column_count=1)).keys()

Minor improvement on Santhosh's solution

dict(cf.get_range(column_count=0,filter_empty=False)).keys()

If you care about order:

OrderedDict(cf.get_range(column_count=0,filter_empty=False)).keys()

get_range returns a generator. We can create a dict from the generator and get the keys from that.

column_count=0 limits results to the row_key. However, because these results have no columns we also need filter_empty.

filter_empty=False will allow us to get the results. However empty rows and range ghosts may be included in our result now.

If we don't mind more overhead, getting just the first column will resolve the empty rows and range ghosts.

dict(cf.get_range(column_count=1)).keys()

回复收藏 0 原文

一场春暖 2024-08-31 16:14:34

Santhosh 和有问题kzarns' 的答案，因为你正在记忆一个可能很大的字典，但你会立即丢弃它。更好的方法是使用列表推导式：

keys = [c[0] for c in cf.get_range(column_count=0, filter_empty=False)]

它迭代 get_range 返回的生成器，将键保留在内存中并存储列表。

如果键列表也可能太大而无法一次将其全部保存在内存中，并且您只需要迭代一次，则应该使用生成器表达式而不是列表理解：

kgen = (c[0] for c in cf.get_range(column_count=0, filter_empty=False))
# you can iterate over kgen, but do not treat it as a list, it isn't!

There's a problem with Santhosh's and kzarns' answers, as you're bringing in memory a potentially huge dict that you are immediately discarding. A better approach would be using list comprehensions for this:

keys = [c[0] for c in cf.get_range(column_count=0, filter_empty=False)]

This iterates over the generator returned by get_range, keeps the key in memory and stores the list.

If the list of keys where also potentially too large to keep it in memory all at once and you only need to iterate once, you should use a generator expression instead of a list comprehension:

kgen = (c[0] for c in cf.get_range(column_count=0, filter_empty=False))
# you can iterate over kgen, but do not treat it as a list, it isn't!

回复收藏 0 原文

~没有更多了~

关于作者

唐婉

暂无简介

0 文章

0 评论

24 人气

关注发私信

友情链接

文江博客

如何使用 pycassa 获取存储在 Cassandra 列族中的所有键？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（5）

关于作者

相关话题

热门标签

推荐作者

胡图图

zt006

z祗昰~

冰葑

野の

天空

友情链接

如何使用 pycassa 获取存储在 Cassandra 列族中的所有键？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（5）

关于作者

相关话题

热门标签

推荐作者

胡图图

zt006

z祗昰~

冰葑

野の

天空

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。