当前位置：文江博客话题详情

hadoop ceph HDFS

Ceph 的 Hadoop 存档实用程序替代方案

发布于 2025-01-09 15:40:32 字数 219 浏览 0 评论 0原文

我的基于 HDFS 的存储上有一些 HAR 文件（Hadoop 存档文件），其中有一些不经常使用的存档数据。

现在我们计划转向基于 Ceph 的存储。所以我有两个问题：

我可以以某种方式在 Ceph 上使用现有的 HAR 文件吗？
CEPH 是否有一些归档实用程序，就像 HDFS 有 Hadoop Archive 实用程序一样？

谢谢

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（1）

猫腻 2025-01-16 15:40:32

我已经有一段时间没有使用 Hadoop，但我可以回答以下问题：

我可以以某种方式在 CEPH 上使用现有的 HAR 文件吗？
虽然我确信 Ceph 中没有对 HAR 的官方支持，但我认为它仍然是可能的，因为 Ceph 文件系统可以用作 Hadoop 文件系统 (HDFS) 的直接替代品。
CEPH 是否有一些存档实用程序，就像 HDFS 有 Hadoop 存档实用程序一样？
自从我每天使用 Ceph 以来，我在 Ceph 中还没有遇到过任何类似于 HAR 的归档实用程序。如您所知，HAR 使用 .tar 扩展名。因此，我一直在做的是使用压缩的 tarball。对于块设备，我将 tarball 存储为 Ceph RBD（rados 块设备）卷。如果我使用对象，我会将 tarball 存档为 RGW 对象。

为了进一步帮助您，我分享了一些有用的线程来深入挖掘：

优化小文件性能：将小文件存储在“superchunks”中[功能]
<一href="https://wiki.softwareheritage.org/wiki/A_practical_approach_to_efficiently_store_100_billions_small_objects_in_Ceph" rel="nofollow noreferrer">在 Ceph 中高效存储 1000 亿个小对象的实用方法
在 Ceph 中存储 200 亿个不可变对象，75% <16KB

回复收藏 0 原文

~没有更多了~

关于作者

暂无简介

文章

评论

26 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

卷耳

文章 0 评论 0

佚名

文章 0 评论 0

℉服软

文章 0 评论 0

qq_2gSKZM

文章 0 评论 0

凉宸

文章 0 评论 0

gyhjy

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文