返回介绍

MinIO HDFS网关

发布于 2020-10-02 16:00:52 字数 2212 浏览 1783 评论 0 收藏 0

MinIO HDFS网关将Amazon S3 API支持添加到Hadoop HDFS文件系统中。应用程序可以同时使用S3和文件API,而无需任何数据迁移。由于网关是无状态且无共享的,因此您可以弹性地分配所需数量的MinIO实例以分配负载。

运行MinIO Gateway进行HDFS存储

使用二进制

通过core-site.xml 自动从hadoop环境变量 $HADOOP_HOME 中读取来获取Namenode信息

export MINIO_ACCESS_KEY=minio
export MINIO_SECRET_KEY=minio123
minio gateway hdfs

您还可以覆盖namenode端点,如下所示。

export MINIO_ACCESS_KEY=minio
export MINIO_SECRET_KEY=minio123
minio gateway hdfs hdfs://namenode:8200

使用 Docker

使用docker是实验性的,大多数Hadoop环境未进行docker化,可能需要其他步骤才能使其正常工作。在这种情况下,最好只使用二进制文件。

docker run -p 9000:9000 \
 --name hdfs-s3 \
 -e "MINIO_ACCESS_KEY=minio" \
 -e "MINIO_SECRET_KEY=minio123" \
 minio/minio gateway hdfs hdfs://namenode:8200

使用MinIO浏览器进行测试

MinIO网关 带有基于Web的嵌入式对象浏览器。将您的Web浏览器指向http://127.0.0.1:9000 ,以确保服务器已成功启动。

屏幕截图

使用MinIO Client进行测试 mc

mc 提供了诸如ls,cat,cp,mirror,diff等UNIX命令的现代替代方案。它支持文件系统和与Amazon S3兼容的云存储服务。

配置 mc

mc config host add myhdfs http://gateway-ip:9000 access_key secret_key

在HDFS上列出存储桶

mc ls myhdfs
[2017-02-22 01:50:43 PST]     0B user/
[2017-02-26 21:43:51 PST]     0B datasets/
[2017-02-26 22:10:11 PST]     0B assets/

已知限制

网关继承了HDFS存储层的以下限制:

  • 没有存储桶策略支持(HDFS没有这样的概念)
  • 不支持存储桶通知API(HDFS不支持fsnotify)
  • 不支持服务器端加密(有意未实现)
  • 不支持服务器端压缩(有意未实现)

路线图

  • 对PutObject操作的其他元数据支持
  • 多部分操作的其他元数据支持
  • 后台附加为多部分操作提供并发支持

如果您希望解决这些问题,请打开GitHub问题。 https://github.com/minio/minio/issues

进一步探索

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。
列表为空,暂无数据
    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文