Hadoop:生成 SequenceFile 的示例过程,其中包含要在 map/reduce 中处理的图像二进制文件
以下 Hadoop:如何访问(许多)照片图像要通过map/reduce处理?问题,其中orangeoctopus提供了加载图像二进制文件并将其收集到 SequenceFiles
中以提供给映射器的合理方向。
认为这对其他人也很有用,作为本地 java 进程或者可能是一个 hadoop 作业(如果有大量图像文件),我创建了这个单独的问题来寻找实现的示例。
谢谢!
Following Hadoop: how to access (many) photo images to be processed by map/reduce? question, where orangeoctopus provides a reasonable direction to load the image binaries and collect them into SequenceFiles
to feed the mapper.
Think this could be useful for the others also, as a local java process or probably a hadoop job in case of vast amount image files, I created this separate question to look for the example for the implementation.
Thanks!
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
Hadoop:权威指南 - 第 4 章提供了一些读取/写入序列文件的示例。这是相同的代码。浏览代码并将其更改为二进制图像作为序列文件的输入。
Hadoop: The Definitive Guide - Chapter 4 has some samples for reading/writing sequence files. Here is the code for the same. Go through the code and change it for the binary images as input for the sequence file.