当前位置：文江博客话题详情

hadoop HDFS MapReduce cloud

Hadoop全分布式模式

发布于 2024-11-14 04:04:58 字数 194 浏览 0 评论 0原文

我是 Hadoop 的新手。我已经成功开发了一个简单的 Map/Reduce 应用程序，该应用程序在“伪分布式模式”下运行良好。我想在“完全分布式模式”下测试它。对此我有几个问题；

处理 1-10GB 的文件大小需要多少台机器（节点）（最少和推荐）？
硬件要求是什么（主要是我想知道核心数量、内存空间和磁盘空间）？

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（1）

感情旳空白 2024-11-21 04:04:58

我会查看 Cloudera 的硬件建议： http://www.cloudera.com/blog/2010/03/clouderas-support-team-shares-some-basic-hardware-recommendations/

该页面的片段

适用于不同工作负载的各种硬件配置，包括我们最初的“基础”推荐：

光处理配置
（1U/机器）：两个四核 CPU，8GB
内存和 4 个磁盘驱动器（1TB 或
2TB）。注意CPU密集型工作
比如自然语言处理
涉及将大型模型加载到
RAM在处理数据之前应该
配置 2GB RAM/核心
而不是 1GB RAM/核心。
平衡计算配置（1U/机器）：两个四核 CPU、16 至 24GB 内存以及使用主板控制器直接连接的 4 个磁盘驱动器（1TB 或 2TB）。这些通常以双胞胎形式提供，在单个 2U 机柜中具有两个主板和 8 个驱动器。
存储重型配置（2U/机器）：两个四核 CPU、16 至 24GB 内存和 12 个磁盘驱动器（1TB 或 2TB）。此类机器的功耗在空闲状态下约为 200W 左右，在活动状态下可高达 350W 左右。
计算密集型配置（2U/机器）：两个四核 CPU、48-72GB 内存和 8 个磁盘驱动器（1TB 或 2TB）。当需要大型内存模型和大量参考数据缓存的组合时，通常会使用它们。

回复收藏 0 原文

~没有更多了~

关于作者

暂无简介

0 文章

0 评论

24 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

Gabu-gabumon

文章 0 评论 0

qq_CgiN62

文章 0 评论 0

荔枝明

文章 0 评论 0

赏烟花じ飞满天

文章 0 评论 0

独守阴晴ぅ圆缺

文章 0 评论 0

¤→小豸慧

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文