HDFS

HDFS

文章 118 浏览 213

带附加功能的 HDFS 是如何工作的

假设一个文件使用默认块大小 (128 MB),并且有一个文件使用 130 MB;因此使用 1 个全尺寸块和 1 个 2 MB 块。然后需要将 20 MB 附加到文件中(现在总…

浅忆流年 2025-01-02 12:46:12 6 0

在小型 HDFS 文件上长时间运行地图任务

想象一个场景,您有一个文本文件,其中有 10000 行,因此当您将其保存在 HDFS 中时,它会非常小。现在您的目标是在这个小文件上运行映射/归约作业,期…

庆幸我还是我 2025-01-01 13:16:25 2 0

不同的hadoop类型文件

Hadoop一般支持这些文件格式:SequenceFile、TFile和Avro。 它支持其他主要格式吗? 图像怎么样?它们是否使用相同的文件格式存储?是否必须以不同的…

扛刀软妹 2025-01-01 10:49:14 6 0

更新 hadoop HDFS 文件

我是 Hadoop 的新手。我一直读到 HDFS 主要是“一次写入,多次读取”。我有一个用例,我可能需要对 HDFS 中存储的文件进行修改。我一直在研究是否有任…

一世旳自豪 2025-01-01 08:14:34 2 0

HDFS 与 GridFS:何时使用哪个?

HDFS 和 GridFS 是分布式文件保存的两种出色技术,但它们有什么区别?哪种类型的问题更适合每种问题?…

浅沫记忆 2024-12-29 21:02:24 3 0

关于hadoop文件系统transferFromLocalFile

我正在编写代码以并行传输文件到 hadoop hdfs。所以我有很多线程调用 filesystem.copyFromLocalFile。 我认为打开一个文件系统的成本不小,所以我的项…

半步萧音过轻尘 2024-12-29 08:09:13 3 0

hbase伪分布式远程连接

我有 HBase 和HDFS 设置并以伪分布式模式工作(在 Mac OSX 上)。我还有一个简单的 Java 应用程序。它在本地使用时有效。 我想让它远程工作。服务器隐…

风追烟花雨 2024-12-29 01:24:48 4 0

使用 hadoop MiniDFSCluster 时出现 javax.management.InstanceAlreadyExistsException

我正在使用 MiniDFSCluster 进行 junit 测试。 现在我只是启动和关闭集群,junit 运行绿色。 但我得到了这个例外: javax.management.InstanceAlready…

小嗷兮 2024-12-28 00:43:02 3 0

启动作业时出现 oozie 问题

命令: oozie job -oozie http://localhost:8080/oozie -config /home/hadoop/Desktop/Cloudera/oozie-2.3.0-cdh3u1/examples/apps/no-op/job.propert…

无人接听 2024-12-27 23:26:32 5 0

HDFS 中使用不同日志文件大小的原理是什么

我目前正在为我设置的新 Hadoop 集群实现一个日志系统。我过去一直看到这些设置的方式是按天分割日志,单个文件以大约 10 倍 HDFS 块大小分割。当我需…

久夏青 2024-12-27 20:37:23 2 0

Hadoop - Map-Reduce 任务如何知道要处理文件的哪一部分?

我已经开始学习 hadoop,目前我正在尝试处理结构不太好的日志文件 - 因为我通常用于 M/R 键的值通常位于文件的顶部(一旦)。所以基本上我的映射函数…

海之角 2024-12-27 19:18:55 5 0

如何使用 Ruby 在 MapR HDFS 中保存文件

有没有办法使用 Ruby 中的 Hadoop MapR 发行版将文件保存在 HDFS 中? 显然,有一个名为 thriftfs 的 Thrift API,可以从客户端与 HDFS 进行通信,但…

雾里花 2024-12-27 13:46:26 5 0

关于hdfs中传输文件

我需要用java代码将文件从一个hdfs文件夹传输到另一个hdfs文件夹。 请问有没有可以调用的api来在hdfs路径之间传输文件? 另外我想问是否有办法从java…

揽清风入怀 2024-12-27 10:29:13 5 0

如何设置HDFS目录时间进行单元测试

我正在尝试对使用 Hadoop 的 HDFS 编程接口的 Java 程序进行单元测试。我需要创建目录并设置它们的时间,以确保我的程序将在正确的时间“清理”目录。…

太阳哥哥 2024-12-25 12:20:01 3 0

Hadoop:生成 SequenceFile 的示例过程,其中包含要在 map/reduce 中处理的图像二进制文件

以下 Hadoop:如何访问(许多)照片图像要通过map/reduce处理?问题,其中orangeoctopus提供了加载图像二进制文件并将其收集到 SequenceFiles 中以提…

黑寡妇 2024-12-24 22:42:26 5 0
更多

推荐作者

qq_VRzBBA45

文章 0 评论 0

痴情

文章 0 评论 0

文章 0 评论 0

Mu.

文章 0 评论 0

凉薄对峙

文章 0 评论 0

不落城

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文