当前位置：文江博客话题详情

分布式系统设计

发布于 2024-10-08 15:58:24 字数 262 浏览 1 评论 0原文

在分布式系统中，某个节点将“X”个工作单元平均分配到“N”个节点（通过套接字消息传递）。

随着工作节点数量的增加，每个节点完成工作的速度更快，但我们必须建立更多的连接。

在实际情况下，这类似于在类似 Hadoop 的系统中更改 10 个节点，每个节点处理 100GB x 1,000,000 个节点，每个节点处理 1MB。

在这种情况下设置更多连接会产生什么影响？ poll() 函数的开销很大吗？
最好的方法是什么？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

我乃一代侩神 2024-10-15 15:58:24

听起来您需要查阅阿姆达尔定律。

至少我是这样计算高速交换机上有多少台机器最适合我的并行计算的。

回复收藏 0 原文

你的往事 2024-10-15 15:58:24

Supervisor 和 Worker 之间是否必须使用套接字和消息传递？

您可以使用某种类型的队列，以避免给 Supervisor 带来负担。或者类似HDFS的分布式文件系统来分发任务并收集结果。

它还取决于您计划部署 Worker 的节点数量。 1,000,000 个节点是一个非常大的数字，因此在这种情况下，您必须将任务分配到多个队列中。

需要注意的是，如果所有节点同时完成任务会发生什么。当他们可以请求新任务时，值得考虑一些可变性。 ZooKeeper (http://hadoop.apache.org/zookeeper/) 也可以用来同步作业。

回复收藏 0 原文

梦晓ヶ微光ヅ倾城 2024-10-15 15:58:24

你能衡量一下你的网络成本吗？在工作机器上花费的时间应该只是消息传递和接收成本的一部分。

您还可以描述将每个工作结果处理到主结果中的 O 符号吗？

您的主循环是否期望得到响应？

顺便说一句——如果您的工作节点完成速度更快但未充分利用 CPU 资源，您可能会错过设计权衡？

当然，你可能是任何法律的规则或例外（争论/过时的研究）。 ;-)

回复收藏 0 原文

~没有更多了~

关于作者

血之狂魔

暂无简介

0 文章

0 评论

22 人气

关注发私信

花开柳相依

文章 0 评论 0

关注

zyhello

文章 0 评论 0

关注

故友

文章 0 评论 0

关注

对风讲故事

文章 0 评论 0

关注

Oo萌小芽oO

文章 0 评论 0

关注

梦明

文章 0 评论 0

友情链接

文江博客

分布式系统设计

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（3）

关于作者

相关话题

热门标签