目录一、认识大数据二、Hadoop生态圈组件介绍 1.1、HDFS(分布式文件系统) 1.2、MapReduce(分布式计算框架) 1.3、Spark(分布式计算框架) 1.4、Flink(分布式计算框架) 1.5、Yarn/Mesos(分布式资源管理器) 1.6、Zookeeper(分布式协作服务) 1.7、Sqoop(数据同步工具) 1.8、Hive/Impala(基于Hadoop的数据仓库) 1.9、HBase(分布式列存储数据库) 1.10、Flume(日志收集工具)三、Hadoop的核心计算框架1、MapReduce分布式计算框架1.1什么是MapReduce2