返回介绍

大数据技术的分析目录(脑图)

发布于 2024-09-24 22:59:00 字数 1879 浏览 0 评论 0 收藏 0

数据采集:ETL 工具

数据存取:关系数据库,NoSQL,NEWSQL 等等。

基础架构支持:云存储,分布式文件系统等等。

计算结果展现:云计算,标签云,关系图等等。

image-20191204222325033

image-20191204222349403

image-20191204222416988

表格 9 大数据不同业务场景下的可选工具表

大场景场景描述可选工具推荐工具
数据存储 HDFS/Mongodb/HBase 
批处理需要对海量数据快速处理。Spark、Flink、MRSpark
实时处理需要实时处理数据并准实时(分钟级)响应。Spark Streaming、Flink、Storm、TridentFlink
机器学习 Spark、 MahouMahou
SQL 查询 Spark、kylin、hive、pig、pig
数据仓库 hive、kylin、 Apache Drillkylin
数据可视大屏、卡片、可视化图表Power BI(Microsoft)、tableAU、superset 
工作流调度任务多且复杂,前后有依赖关系。Apache Ooize、Azkaban、Cascading、Hanmake、Zeus(阿里)、LTS(华为) 
集群管理 Apache Mesos、Google Kubernetes、Docker Swarm、 
运维监控 ELK、Splunk、Nagios、supervisor 

备注:1. Apache ZooKeeper 是分布式、可用性高的协调服务,可用来监控节点状态。

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。
列表为空,暂无数据
    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文