当前位置：文江博客话题详情

NoSQL cassandra bigtable datamodel

Cassandra/BigTable 数据模型 - 构建索引的最佳方法是什么？

发布于 2024-09-11 07:06:06 字数 463 浏览 11 评论 0原文

我正在为 PenWag.com 进行从 MySQL 到 Cassandra 的转换。在 Cassandra 中，我存储通过 GUID 关闭的用户，但用户使用他们的电子邮件登录，而不是 GUID（显然）。 GUID 作为用户的密钥对我来说比电子邮件更有意义，原因有两个。从实际角度来看，更改或删除/添加一行及其所有超级列似乎太麻烦了。从理论上来看，它仍然是同一个用户，为什么他们的密钥要改变？

不过，这是我的问题：我正在单独的 ColumnFamily 中构建索引，映射 email->GUID 以支持登录。它是标准类型 CF，其中列名称为 email，值为 GUID。这是标准，而不是超级，以避免为每个映射加载整个 SC。支持“更改电子邮件”很简单，只需删除/添加列即可。但似乎另一种方法是将索引存储为行而不是列，其中行键是电子邮件，列保存 GUID。删除/添加这些行不会很麻烦，因为只有列（GUID）需要管理。

看来这两种方法都有效。各自的优点和缺点是什么？有最佳实践吗？

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（2）

沒落の蓅哖 2024-09-18 07:06:07

由于我没有使用 Cassandra 或类似数据库的实践经验，因此您需要对我的回答持保留态度:)

如果您将每个映射存储为一列，并使用电子邮件地址作为列名称，则这意味着单行包含大量列。根据维基百科^[1]：

无论读取或写入多少列，单个行键下的每个操作对于每个副本都是原子的。

如果所有映射都存储在单行中，这可能会导致大量的锁定开销。

Cassandra Wiki 指出^[2]：

行键决定存储数据的机器。

这让我相信根据行键进行查找比根据列名进行查找更有效。基于此信息，我建议使用电子邮件地址作为行键并将 GUID 存储在列中。

回复收藏 0 原文

笑看君怀她人 2024-09-18 07:06:07

尼尔斯是正确的；每个用户一行是手动执行此操作的正确方法。

我对此有资格，因为在 0.7 中，您可以在行中包含一个电子邮件列，其中包含其余由 UUID 键入的用户数据，并要求 Cassandra 将其编入索引： http://www.riptano.com/blog/whats-new-cassandra-07-secondary-indexes

回复收藏 0 原文

~没有更多了~

关于作者

暂无简介

文章

评论

27 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

琉璃梦幻

文章 0 评论 0

qq_4zWU6L

文章 0 评论 0

话少情深

文章 0 评论 0

西西弗的石头怪

文章 0 评论 0

彻夜缠绵

文章 0 评论 0

千寻…

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文