# 大数据 ## 流式计算 ### Storm * [官方网站](http://storm.apache.org/) * [《最详细的Storm入门教程》](https://blog.csdn.net/uisoul/article/details/77989927) ### Flink * [《Flink之一 Flink基本原理介绍》](https://blog.csdn.net/lisi1129/article/details/54844919) ### Kafka Stream * [《Kafka Stream调研:一种轻量级流计算模式》](https://yq.aliyun.com/articles/58382) ### 应用场景 例如: * 广告相关实时统计; * 推荐系统用户画像标签实时更新; * 线上服务健康状况实时监测; * 实时榜单; * 实时数据统计。 ## Hadoop * [《用通俗易懂的话说下hadoop是什么,能做什么》](https://blog.csdn.net/houbin0912/article/details/72967178) * [《史上最详细的Hadoop环境搭建》](http://gitbook.cn/books/5954c9600326c7705af8a92a/index.html) ### HDFS * [《【Hadoop学习】HDFS基本原理》](https://segmentfault.com/a/1190000011575458) ### MapReduce * [《用通俗易懂的大白话讲解Map/Reduce原理》](https://blog.csdn.net/oppo62258801/article/details/72884633) * [《 简单的map-reduce的java例子》](https://blog.csdn.net/foye12/article/details/78358292) ### Yarn * [《初步掌握Yarn的架构及原理》](http://www.cnblogs.com/codeOfLife/p/5492740.html) ## Spark * [《Spark(一): 基本架构及原理》](http://www.cnblogs.com/tgzhu/p/5818374.html) * [《子雨大数据之Spark入门教程(Python版)》](http://dblab.xmu.edu.cn/blog/1709-2/)