参考资料
重要网站
中国大数据产业观察 http://www.cbdio.com/
项目官网
Apache 项目
- Apache HBase 官网 http://hbase.apache.org/
- Apache Hive http://hive.apache.org/
- Apache Pig http://pig.apache.org/
- Apache Spark http://spark.apache.org/
- Apache log4j http://logging.apache.org/log4j/index.html
- Apache Nutch http://nutch.apache.org/
- Apache Lucene http://lucene.apache.org/
- Apache Thrift http://thrift.apache.org/
- Apache Avro http://avro.apache.org/
- Apache ZooKeeper http://zookeeper.apache.org/
其它开源项目
- Protocal Buffer 官方主页 http://code.google.com/p/protobuf/
- kettle http://kettle.pentaho.com/
- Cloudera 官方博客 http://blog.cloudera.com/blog/
- Cascading 官方主页 http://www.cascading.org/
- Azkaban 官方主页 http://sna-projects.com/azkaban/
- Facebook Hadoop 代码 https://github.com/facebook/hadoop-20
商业项目
- splunk https://www.splunk.com
日志系统
- scribe 主页 https://github.com/facebook/scribe
- Apache chukwa 主页 http://incubator.apache.org/chukwa/
- kafka 主页 h ttp://sna-projects.com/kafka/
- Flume 主页 http s://github.com/cloudera/flume/
- ELK
调度系统
- Apache Mesos 官网 http://mesos.apache.org/documentation/latest/
- Apache YARN 官网 http://hadoop.apache.org/common/docs/r0.23.0/index.html
- Apache Oozie 官网 http://incubator.apache.org/oozie/ .
官网文档资源
Filebeat :
- https://www.elastic.co/cn/products/beats/filebeat
- https://www.elastic.co/guide/en/beats/filebeat/5.6/index.html
Logstash :
Kibana:
Elasticsearch
- https://www.elastic.co/cn/products/elasticsearch
- https://www.elastic.co/guide/en/elasticsearch/reference/5.6/index.html
- elasticsearch 中文社区 https://elasticsearch.cn/
- Hadoop-ES https://www.elastic.co/guide/en/elasticsearch/hadoop/current/float.html
参考书目
中文书
[1]. Anand Rajaraman、Jeffrey David Ullman / 王斌 《大数据 : 互联网大规模数据挖掘与分布式处理》/ 人民邮电出版社 / 2012-9
[2]. 董西成 《Hadoop 技术内幕 : 深入解析 MapReduce 架构设计与实现原理》/ 机械工业出版社 / 2013-4
[3]. [奥地利]Dietmar Jannach、Markus Zanker、Alexander Felfernig、Gerhard Friedrich / 蒋凡译 《推荐系统》 / 人民邮电出版社 / 2013-6-25
[4]. Toby Segaran / 莫映、王开福 《集体智慧编程》/ 电子工业出版社 / 2015-3
[5]. Mesos 论文:Mesos: A Platform for Fine-Grained Resource Sharing in the Data Center. B. Hindman, A. Konwinski, M. Zaharia, A. Ghodsi, A.D. Joseph, R. Katz, S. Shenker and I. Stoica, NSDI 2011, March 2011.
[6]. Tom White.周敏奇,王晓玲,金澈清,钱卫宁译. Hadoop 权威指南.2 版. 北京:清华大学出版社,2011.
[7]. Chuck Lam.韩冀中译. Hadoop 实战.北京:人民邮电出版社,2011.
英文书
- Ian H.Witten,Eide Frank Data Mining: Practical Learning Tools and Techniques with Java Implementations Elsevier 2003
- Rafal Kuc 《Apache Solr 4 Cookbook》/ Packt Publishing / 2013-1-25
- Alberto Paro 《ElasticSearch Cookbook, Second Edition》/ Packt Publishing - ebooks Account / 2015-1-28
- Eric Sammer.Hadoop Operations.O’Reilly Media,2012.
参考链接
- 讲透大数据,我只需要一顿饭 http://www.thebigdata.cn/YeJieDongTai/35476.html
- 读完这 100 篇论文 就能成大数据高手 https://www.jianshu.com/p/7ffa50f4d4f0
- 董的博客 http://dongxicheng.org
- 一文遍历大数据架构变迁史 https://mp.weixin.qq.com/s/m5miKpESJnBhvTSMkX8eQw
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论