Cassandra 有什么好的批量数据加载工具

发布于 2024-11-05 06:36:57 字数 105 浏览 3 评论 0原文

我正在寻找一个将 CSV 加载到 Cassandra 中的工具。我本来希望使用 RazorSQL 来完成此任务,但我被告知这需要几个月的时间。

什么是好工具?

谢谢

I'm looking for a tool to load CSV into Cassandra. I was hoping to use RazorSQL for this but I've been told that it will be several months out.

What is a good tool?

Thanks

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(3

想挽留 2024-11-12 06:36:57

1) 如果您已准备好所有要加载的数据,您可以尝试使用 sstableloader(仅适用于 cassandra 0.8.x 及以上版本)实用程序批量加载数据。有关更多详细信息,请参阅:cassandra 批量加载器

2) Cassandra在最新版本 cassandra-1.1.x 开始,引入了 BulkOutputFormat 通过 hadoop 作业将数据批量加载到 cassandra 中。
有关更多详细信息,请参阅:使用 Hadoop 批量加载到 Cassandra

1) If you have all the data to be loaded in place you can try sstableloader(only for cassandra 0.8.x onwards) utility to bulk load the data.For more details see:cassandra bulk loader

2) Cassandra has introduced BulkOutputFormat bulk loading data into cassandra with hadoop job in latest version that is cassandra-1.1.x onwards.
For more details see:Bulkloading to Cassandra with Hadoop

小草泠泠 2024-11-12 06:36:57

我怀疑工具支持是否能在很大程度上帮助解决这个问题,因为 Cassandra 架构需要反映您想要运行的查询,而不仅仅是您域的通用模型。

cassandra 的内置批量加载机制是通过 BinaryMemtables 实现的: http://wiki.apache.org/cassandra/ BinaryMemtable

但是,无论您使用此接口还是更常用的 Thrift 接口,您仍然可能需要手动设计从 CSV 到 Cassandra ColumnFamilies 的映射,同时考虑到您的查询需要运行。来自 CSV-> 的通用映射Cassandra 可能不合适,因为通常需要二级索引和非规范化。

I'm dubious that tool support would help a great deal with this, since a Cassandra schema needs to reflect the queries that you want to run, rather than just being a generic model of your domain.

The built-in bulk loading mechanism for cassandra is via BinaryMemtables: http://wiki.apache.org/cassandra/BinaryMemtable

However, whether you use this or the more usual Thrift interface, you still probably need to manually design a mapping from your CSV into Cassandra ColumnFamilies, taking into account the queries you need to run. A generic mapping from CSV-> Cassandra may not be appropriate since secondary indexes and denormalisation are commonly needed.

爱她像谁 2024-11-12 06:36:57
~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文