为什么Spark比Hadoop地图快100倍

发布于 2025-01-28 20:24:00 字数 146 浏览 5 评论 0原文

为什么火花比Hadoop MapReduce快？根据我的理解，由于内存处理是否更快，因此Hadoop也将数据加载到RAM中，然后将其加载到RAM中。每个程序首先加载到RAM，然后执行。因此，我们可以说Spark正在进行内存处理，为什么其他大数据技术不这样做。你能解释一下我吗？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

迷雾森÷林ヴ 2025-02-04 20:24:01

从MapReduce中学到的所有课程创造了Spark。它不是第2代，它是使用类似概念重新设计的，但确实在地图中学习缺失/所做的事情。

MapReduce分区数据，读取数据，执行映射，写入磁盘，发送给reducer，将其写入磁盘，然后读取它，然后将其降低，然后将其写入磁盘。很多写作和阅读。如果您想执行另一个操作，您将重新开始整个周期。

Spark，试图将其保存在内存中，而它执行多个地图/操作，但它仍然确实会传输数据，但仅在必须并使用智能逻辑来弄清楚它如何优化您要求它的内容时才进行传输。在记忆中是有用的，但不是唯一的事情。

回复收藏 0 原文

~没有更多了~

关于作者

心的憧憬

暂无简介

文章

26 人气

关注发私信

友情链接

文江博客

为什么Spark比Hadoop地图快100倍

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

夢野间

百度③文鱼

小草泠泠

zhuwenyan

weirdo

坚持沉默

友情链接

为什么Spark比Hadoop地图快100倍

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

夢野间

百度③文鱼

小草泠泠

zhuwenyan

weirdo

坚持沉默

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。