当前位置：文江博客话题详情

是否可以并行从多个客户端附加到 HDFS 文件？

发布于 2024-11-16 03:09:25 字数 194 浏览 4 评论 0原文

基本上整个问题都在标题中。我想知道是否可以同时从多台计算机附加到位于 HDFS 上的文件？比如存储由多个进程不断产生的事件流。顺序并不重要。

我记得在一次 Google 技术演示中听说 GFS 支持此类附加功能，但尝试使用 HDFS 进行一些有限的测试（使用常规文件 append() 或使用 SequenceFile）似乎不起作用。

谢谢，

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

太阳公公是暖光 2024-11-23 03:09:25

我认为 HDFS 不可能做到这一点。即使您不关心记录的顺序，但您确实关心文件中字节的顺序。您不希望写入器 A 写入部分记录，然后被写入器 B 损坏。这是 HDFS 无法自行解决的难题，因此它不会这样做。

为每个写入器创建一个文件。将所有文件传递给任何需要读取此数据的 MapReduce 工作程序。这更加简单并且适合HDFS和Hadoop的设计。如果非 MapReduce 代码需要将这些数据作为一个流读取，那么要么按顺序流式传输每个文件，要么编写一个非常快速的 MapReduce 作业来合并文件。

回复收藏 0 原文

你穿错了嫁妆 2024-11-23 03:09:25

仅供参考，根据官方网站上的 JIRA 项目，hadoop 2.6.x 可能会完全支持它： https://issues.apache.org/jira/browse/HDFS-7203

回复收藏 0 原文

~没有更多了~

关于作者

东走西顾

暂无简介

0 文章

0 评论

24 人气

关注发私信

友情链接

文江博客

是否可以并行从多个客户端附加到 HDFS 文件？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

胡图图

zt006

z祗昰~

冰葑

野の

天空

友情链接

是否可以并行从多个客户端附加到 HDFS 文件？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

胡图图

zt006

z祗昰~

冰葑

野の

天空

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。