当前位置：文江博客话题详情

带附加功能的 HDFS 是如何工作的

发布于 2025-01-02 12:46:12 字数 268 浏览 6 评论 0原文

假设一个文件使用默认块大小 (128 MB)，并且有一个文件使用 130 MB；因此使用 1 个全尺寸块和 1 个 2 MB 块。然后需要将 20 MB 附加到文件中（现在总计应为 150 MB）。会发生什么？

HDFS 实际上是否将最后一个块的大小从 2MB 调整为 22MB？或者创建一个新块？

向 HDFS 中的文件追加内容如何处理并发性？是否存在数据丢失的风险？

HDFS是否创建第三个块，将20+2MB放入其中，并删除2MB的块。如果是，它是如何同时工作的？

需要登录才能够评论，你可以免费注册一个本站的账号。

并安 2025-01-09 12:46:12

根据最新设计文档中的Jira 问题前面提到，我们找到您问题的以下答案：

HDFS 将附加到最后一个块，< em>不创建一个新块并从旧的最后一个块复制数据。这并不困难，因为 HDFS 只是使用普通文件系统将这些块文件作为普通文件写入。普通文件系统具有附加新数据的机制。当然，如果你填满了最后一个区块，你就会创建一个新的区块。
HDFS 中只允许同时对任何文件进行一次写入或追加，因此无需处理并发。这是由名称节点管理的。如果您希望其他人开始写入文件，则需要关闭该文件。
如果文件中的最后一个块没有被复制，追加将会失败。追加被写入单个副本，该副本将其通过管道传输到副本，类似于正常写入。在我看来，与正常写入相比，不存在额外的数据丢失风险。