如何读取 Hadoop Sequentil 文件作为 Hadoop 作业的输入?

发布于 2024-12-26 01:43:16 字数 259 浏览 1 评论 0原文

我有一个顺序文件,其类型为 "org.apache.hadoop.typedbytes.TypedBytesWritable" 的键值对,我必须提供此文件作为 Hadoop 作业的输入并必须进行处理仅在地图中。我的意思是我不必做任何需要减少的事情。

1)我如何将 FileInputFormat 指定为 SequentialFile ?

2)map函数的签名是什么。

3)我如何从map而不是Reduce中获取输出?

I have a Sequential file which has the key-value pair of type "org.apache.hadoop.typedbytes.TypedBytesWritable" , I have to provide this file as the input to the Hadoop job and have to process it in map only. I mean i dont have to do anything which will need reduce.

1) How will i specify the FileInputFormat as SequentialFile ?

2) What will be the signature of map function.

3) How will i get output from map instead of Reduce?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

我们只是彼此的过ke 2025-01-02 01:43:16

1) 我如何将 FileInputFormat 指定为 SequentialFile ?

设置 SequenceFileAsBinaryInputFormat作为输入格式。这是 代码 SequenceFileAsBinaryInputFormat 类。

这是代码

JobConf conf = new JobConf(getConf(), getClass());
conf.setInputFormat(SequenceFileAsBinaryInputFormat.class);

2)地图函数的签名是什么。

该映射将使用 BytesWritable 作为键和值类型来调用。

3)我如何从map而不是Reduce中获取输出?

将mapred.reduce.tasks属性设置为0。map的输出将是作业的最终输出。


另外,请查看 SequenceFileAsTextInputFormat。将以 Text 作为键和值类型来调用地图。

1) How will i specify the FileInputFormat as SequentialFile ?

Set the SequenceFileAsBinaryInputFormat as the input format. Here is the code for the SequenceFileAsBinaryInputFormat class.

Here is the code

JobConf conf = new JobConf(getConf(), getClass());
conf.setInputFormat(SequenceFileAsBinaryInputFormat.class);

2) What will be the signature of map function.

The map would be invoked with a BytesWritable as key and value types.

3) How will i get output from map instead of Reduce?

Set the mapred.reduce.tasks property to 0. The output of the map will be the final output of the job.


Also, take a look at the SequenceFileAsTextInputFormat. The map would be invoked with Text as key and value types.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文