文章来源于网络收集而来,版权归原创者所有,如有侵权请及时联系!
大数据技术的分析目录(脑图)
数据采集:ETL 工具
数据存取:关系数据库,NoSQL,NEWSQL 等等。
基础架构支持:云存储,分布式文件系统等等。
计算结果展现:云计算,标签云,关系图等等。
表格 9 大数据不同业务场景下的可选工具表
大场景 | 场景描述 | 可选工具 | 推荐工具 |
---|---|---|---|
数据存储 | HDFS/Mongodb/HBase | ||
批处理 | 需要对海量数据快速处理。 | Spark、Flink、MR | Spark |
实时处理 | 需要实时处理数据并准实时(分钟级)响应。 | Spark Streaming、Flink、Storm、Trident | Flink |
机器学习 | Spark、 Mahou | Mahou | |
SQL 查询 | Spark、kylin、hive、pig、 | pig | |
数据仓库 | hive、kylin、 Apache Drill | kylin | |
数据可视 | 大屏、卡片、可视化图表 | Power BI(Microsoft)、tableAU、superset | |
工作流调度 | 任务多且复杂,前后有依赖关系。 | Apache Ooize、Azkaban、Cascading、Hanmake、Zeus(阿里)、LTS(华为) | |
集群管理 | Apache Mesos、Google Kubernetes、Docker Swarm、 | ||
运维监控 | ELK、Splunk、Nagios、supervisor |
备注:1. Apache ZooKeeper 是分布式、可用性高的协调服务,可用来监控节点状态。
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论