Hadoop介绍Hadoop-大数据开源世界的亚当夏娃。核心是HDFS数据存储系统,和MapReduce分布式计算框架。HDFS原理是把大块数据切碎,每个碎块复制三份,分开放在三个廉价机上,一直保持有三块可用的数据互为备份。使用的时候只从其中一个备份读出来,这个碎块数据就有了。存数据的叫datenode(格子间),管理datenode的叫namenode(执伞人)。MapReduce原理是大任务先分堆处理-Map,再汇总处理结果-Reduce。分和汇是多台服务器并行进行,才能体现集群的威力。难度在于如何把任务拆解成符合MapReduce模型的分和汇,以及中间过程的输入输出都是什么。单机版Had