当前位置：文江博客话题详情

单击按钮即可进行大数据处理

发布于 2024-11-07 18:30:07 字数 286 浏览 0 评论 0原文

如果您有一个应用程序对大型数据集执行一些繁重的计算，并且必须通过单击按钮尽快返回结果，那么有哪些架构设计可用于使这项工作大规模化？

例如，应用程序运行模拟来预测未来结果，然后对该数据以及历史数据进行一些统计分析。有大量的 CPU 来运行模拟，数据库需要大量插入，然后需要大量的大数据库读取来收集历史数据，还有更多的 CPU 来进行统计分析。

本质上，有大量数据需要处理（CPU 和 IO 密集型），理论上单击按钮即可显示结果。

我知道这并不总是一个现实的目标，具体取决于强度，但是完成此类任务的典型架构有哪些？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

北渚 2024-11-14 18:30:07

谷歌这样做是为了返回搜索结果。

查看 Hadoop - http://hadoop.apache.org/ - 特别是 MapReduce。

“Hadoop MapReduce 是一种编程模型和软件框架，用于编写在大型计算节点集群上快速并行处理大量数据的应用程序。”

回复收藏 0 原文

〃温暖了心ぐ 2024-11-14 18:30:07

Rob 建议了一种使用 MapReduce 的好方法。

我相信这种处理是数据挖掘过程的一部分，数据挖掘过程具有与传统请求响应模型不同的方法。

至少

创建一个表（非规范化）并将所有必要的信息存储在该表中，然后当用户实时需要该信息时，只需进行表查找并尽快获取信息。

但这种方法存在挑战，主要挑战之一是在这个非规范化表中填充数据。

大多数时候，它可以通过夜间工作或负载最小时填充此表的其他方式离线完成！

此方法是在典型的电子商务应用程序中看到“购买此商品的客户也购买了”时使用的方法之一。

有关更多信息和参考，请参阅

1- Sql Server Analysis Services

2- 项目到项目协同过滤（特别是参考亚马逊实施）

回复收藏 0 原文

~没有更多了~

关于作者

滴情不沾

暂无简介

0 文章

0 评论

24 人气

关注发私信

lorenzathorton8

文章 0 评论 0

关注

Zero

文章 0 评论 0

关注

萧瑟寒风

文章 0 评论 0

关注

mylayout

文章 0 评论 0

关注

tkewei

文章 0 评论 0

关注

17818769742

文章 0 评论 0

友情链接

文江博客

单击按钮即可进行大数据处理

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签