如何使用BulkOutputFormat将数据从Hadoop Map功能流式传输到Cassandra?
1) 我在 Hadoop 作业映射中有行键、列和值,我发现我可以使用 BulkOutputFormat 将其直接流式传输到 Cassandra。
2)我已经阅读了代码,但很难理解如何使用它。 如何使用此 BulkOutputFormat API 将数据流式传输到 Cassandra?
由于尚未提供更多相关文档,我请求 Cassandra 专家指导我完成此操作。 一个小代码片段会非常有帮助。 我计划用当前的开发版本来测试它。
1) I have the row-key, column and value in Map of Hadoop Job and I came to know that I can stream this directly to Cassandra using BulkOutputFormat.
2) I have gone through the code but it is quite difficult to understand how to use it.
How can I use this BulkOutputFormat API to stream the data to Cassandra?
As the more documentation is not yet available on this I request the Cassandra Experts to guide me through this.
A small code snippet would be very helpful.
I am planning to test it with current development version.
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
通过研究 cassandra 源代码和 cassandra JIRA,我找到了使用 BulkOutputFormat 的方法,并在此处进行了描述:通过 Hadoop 使用 BulkOutputFormat 将数据加载到 cassandra
By looking into cassandra source code and cassandra JIRA I have figured out the way to use BulkOutputFormat and described it here:Using BulkOutputFormat to load data to cassandra with Hadoop