目录一、概述二、架构1)数据导入(RDBMS->Haoop)2)数据导出(Haoop->RDBMS)三、安装1)下载2)配置环境变量3)配置sqoop代理用户4)安装JDBC5)修改conf/sqoop.properties6)存储库初始化7)启动sqoop服务端8)启动sqoop客户端9)设置客户端的各种属性四、简单使用1)常用命令2)数据从MYSQL导入到HDFS(Import)1、创建JDBC连接2、创建HDFS连接3、创建Job任务4、执行Job3)从HDFS导出到MYSQL(Export)1、创建集群测试表和数据2、创建MYSQL接收表3、创建MYSQL连接4、创建HDFS连接5、创
目录一、ApachePig概述二、ApachePig架构1)架构图2)ApachePig组件1、Parser(解析器)2、Optimizer(优化器)3、Compiler(编译器)4、Executionengine(执行引擎)三、ApachePig安装1)下载ApachePig2)配置环境变量3)修改配置四、ApachePig执行模式1)本地模式2)Tez本地模式3)Spark本地模式4)MapReduce模式(默认模式)5)Tez模式6)Spark模式五、ApachePig执行机制1)交互模式(Gruntshell)2)批处理模式(脚本)3)嵌入式模式(UDF)六、PigLatin基础知识1
目录一、概述二、Oozie架构三、Oozie环境部署(Oozie与CDH集成)1)添加服务2)将Oozie服务添加到CDH3)自定义角色分配4)数据库设置5)审核更改6)开始自动安装并自启四、CDH的Hue整合Oozie五、Oozie简单使用1)在Hue上操作Oozie1、利用Hue调度shell脚本2、利用Hue调度hive脚本3、利用Hue配置定时调度任务2)CLI操作Oozie1、CLI调度shell脚本2、执行多个任务job3、调度MR任务4、调度定时任务3)JavaAPI操作Oozie六、常用命令七、Oozie与Azkaban对比一、概述Oozie是一个基于工作流引擎的开源框架,依赖
目录一、概述二、Hue架构三、Hue安装1)安装数据源2)安装docker3)通过Docker快速安装3)通过CM安装集成到CDH1、添加服务2、将Hue服务添加到CDH3、自定义角色分配4、数据库设置5、安装完成6、启动hue服务7、创建账户4)官方demo演示四、Hue简单使用1)通过Hue操作HDFS2)通过Hue操作Impala3)通过Hue操作Hive一、概述Hue是一个开源的ApacheHadoopUI系统,最早是由ClouderaDesktop演化而来,由Cloudera贡献给开源社区,它是基于PythonWeb框架Django实现的。通过使用Hue我们可以在浏览器端的Web控制
目录一、概述1)目前比较流行Hadoop版本2)CDH特点二、CDH组件介绍1)Hive2)Impala1、Impala优势2、工作原理3、Impala查询原理4、Impala的特性3)Kudu1、Kudu优势2、Kudu-Impala集成5)Sentry6)Spark三、ClouderaManager1)Terminology(术语)2)Architecture(架构)3)心跳检测4)StateManagement(状态管理)5)ConfigurationManagement(配置管理)1、HostTemplates(主机模板)2、ServerandClientConfiguration(服
目录一、概述二、架构1)数据导入(RDBMS->Haoop)2)数据导出(Haoop->RDBMS)三、安装1)下载2)配置环境变量3)配置sqoop代理用户4)安装JDBC5)修改conf/sqoop.properties6)存储库初始化7)启动sqoop服务端8)启动sqoop客户端9)设置客户端的各种属性四、简单使用1)常用命令2)数据从MYSQL导入到HDFS(Import)1、创建JDBC连接2、创建HDFS连接3、创建Job任务4、执行Job3)从HDFS导出到MYSQL(Export)1、创建集群测试表和数据2、创建MYSQL接收表3、创建MYSQL连接4、创建HDFS连接5、创
目录一、ApachePig概述二、ApachePig架构1)架构图2)ApachePig组件1、Parser(解析器)2、Optimizer(优化器)3、Compiler(编译器)4、Executionengine(执行引擎)三、ApachePig安装1)下载ApachePig2)配置环境变量3)修改配置四、ApachePig执行模式1)本地模式2)Tez本地模式3)Spark本地模式4)MapReduce模式(默认模式)5)Tez模式6)Spark模式五、ApachePig执行机制1)交互模式(Gruntshell)2)批处理模式(脚本)3)嵌入式模式(UDF)六、PigLatin基础知识1
目录一、概述二、Oozie架构三、Oozie环境部署(Oozie与CDH集成)1)添加服务2)将Oozie服务添加到CDH3)自定义角色分配4)数据库设置5)审核更改6)开始自动安装并自启四、CDH的Hue整合Oozie五、Oozie简单使用1)在Hue上操作Oozie1、利用Hue调度shell脚本2、利用Hue调度hive脚本3、利用Hue配置定时调度任务2)CLI操作Oozie1、CLI调度shell脚本2、执行多个任务job3、调度MR任务4、调度定时任务3)JavaAPI操作Oozie六、常用命令七、Oozie与Azkaban对比一、概述Oozie是一个基于工作流引擎的开源框架,依赖
目录一、概述二、Hue架构三、Hue安装1)安装数据源2)安装docker3)通过Docker快速安装3)通过CM安装集成到CDH1、添加服务2、将Hue服务添加到CDH3、自定义角色分配4、数据库设置5、安装完成6、启动hue服务7、创建账户4)官方demo演示四、Hue简单使用1)通过Hue操作HDFS2)通过Hue操作Impala3)通过Hue操作Hive一、概述Hue是一个开源的ApacheHadoopUI系统,最早是由ClouderaDesktop演化而来,由Cloudera贡献给开源社区,它是基于PythonWeb框架Django实现的。通过使用Hue我们可以在浏览器端的Web控制
目录一、概述1)目前比较流行Hadoop版本2)CDH特点二、CDH组件介绍1)Hive2)Impala1、Impala优势2、工作原理3、Impala查询原理4、Impala的特性3)Kudu1、Kudu优势2、Kudu-Impala集成5)Sentry6)Spark三、ClouderaManager1)Terminology(术语)2)Architecture(架构)3)心跳检测4)StateManagement(状态管理)5)ConfigurationManagement(配置管理)1、HostTemplates(主机模板)2、ServerandClientConfiguration(服