草庐IT

logstash-input-jdbc

全部标签

java - 如何为从配置单元 jdbc 查询启动的 mr 作业指定额外的 jar?

我正在尝试通过使用avro存储格式的jdbc查询一个配置单元表,但我在查询产生的mr作业中收到一个类未找到错误。奇怪的是,我可以从配置单元shell运行查询而不会发生异常。我可以运行一个不生成mapreduce作业的查询(select*fromtablelimit10)并且它工作正常。2014-03-1210:23:34,040WARN[main]org.apache.hadoop.mapred.YarnChild:Exceptionrunningchild:java.io.IOException:java.lang.reflect.InvocationTargetExceptiona

hadoop - 与 Shark 服务器的 JDBC 连接挂起

我正在为我的shark集群使用以下配置Scala2.10.3星火0.9.0配置单元0.12.0-chd5.0.2鲨鱼0.9.0Spark和Hive通过Cloudera管理器(CDH5.0.2)配置我正在按照本教程连接到shark服务器:https://cwiki.apache.org/confluence/display/Hive/HiveClient我按如下方式启动shark服务器:./shark--servicesharkserver9956我可以使用上述教程中的代码连接到配置单元服务器。但是当我尝试连接到鲨鱼服务器时,它卡在了这一行Connectioncon=DriverMana

java - 信息 : Transport Used for JDBC connection: null + Apache Hive

我正在尝试通过JDBC连接ApacheHive和eclipse,但出现以下错误。以下是版本信息:ApacheHadoop:2.7.1,Hive:1.2.1和EclipseKepler。****Error:****Dec29,20156:04:00PMorg.apache.hive.jdbc.UtilsparseURLINFO:Suppliedauthorities:localhost:10000Dec29,20156:04:00PMorg.apache.hive.jdbc.UtilsparseURLINFO:Resolvedauthority:localhost:10000Dec29,

java - CDH4、Sqoop2 和 JDBC 驱动程序 : no suitable driver found

我正在尝试使用Sqoop2将数据从MySQL数据库导入HDFS,基本上遵循说明here.但是,由于找不到合适的驱动程序,Sqoop服务器无法连接到MySQL数据库。设置:这是我的设置的一些背景:Hadoop集群:我有一个运行CDH4.4.0的三机Hadoop集群。Sqoop2是通过ClouderaManager配置的,与Namenode运行在同一台机器上。我正在Windows机器上开发,这也是我的MySQL数据库所在的位置。Hadoop集群是一组三台Ubuntu服务器机器。MySQL数据库:我的Windows机器上运行着一个MySQL数据库,我已经检查过可以从我的Hadoop集群中的每

java - org.apache.hive.jdbc.HiveStatement/org.apache.hadoop.hive.jdbc.HiveStatement 之间的区别

我一直在使用围绕Hadoop的产品,但对于使用Java开发应用程序还是个新手。我想用一些像HiveStatement这样的类,但是发现有同名类不同包。ex)org.apache.hive.jdbc.HiveStatement,org.apache.hadoop.hive.jdbc.HiveStatement.我在尝试将Statement对象转换为HiveStatement时注意到了这一点。我试图将对象转换为org.apache.hadoop.hive.jdbc.HiveStatement,但转换为org.apache.hive.jdbc.HiveStatement似乎对我来说是正确的案

使用docker实现logstash同步mysql到es

目录ES同步工具简介准备工作一、创建配置文件,用于容器卷挂载二、启动容器相关问题汇总:logstash同步mysql数据到es(一、es模板问题,请求返回400)logstash同步mysql数据到es(二、jdbc_driver_library问题)_(pleasecheckuserandgrouppermissionsforthep-CSDN博客logstash同步mysql数据到es(三、es模板问题)-CSDN博客使用docker实现logstash同步mysql到es-CSDN博客ES同步工具简介Elasticsearch(简称ES)是一个开源的分布式搜索和分析引擎,它提供了丰富的功

hadoop - Input Split 大小是常量还是取决于逻辑记录?

Hadoop权威指南说:WhenyouhaveMinimumsplitsize1,MaximumsplitsizeLong.MAX_VALUE,Blocksize64MBthentheSplitsizeis64MB.TextInputFormat的逻辑记录是行。由于每行长度不同,我们如何才能将大小拆分为恰好64MB? 最佳答案 HDFSblock是字节序列。他们不知道线条或任何其他结构。所以你可能有一个只有一个block(当然大小为64MB)的分割,在一行的中间结束(即不包括整个最后一行)。当您使用TextInputFormat读取

Hadoop 映射器 : Appropriate input files size?

我的集群HDFSblock大小为64MB。我有包含100个纯文本文件的目录,每个文件的大小为100MB。作业的InputFormat是TextInputFormat。将运行多少个映射器?我在HadoopDeveloper考试中看到了这个问题。答案是100。其他三个答案选项是64、640、200。但我不确定100是怎么来的,或者答案是错误的。请指导。提前致谢。 最佳答案 我同意你的判断,这似乎是错误的当然除非有更多的考试问题没有发布:这些“纯”文本文件是否经过gzip压缩-在这种情况下它们不可拆分?)簇分割大小可能是64MB,但输入文

java - 无法通过 jdbc 连接到配置单元

我使用gradle来运行我的程序。示例代码引用https://github.com/onefoursix/Cloudera-Impala-JDBC-Example.而且我可以从repo中运行示例而不会失败。//ApplythejavaplugintoaddsupportforJavaapplyplugin:'java'applyplugin:'application'mainClassName="com.my.impala.fetcher.Fetcher"//Inthissectionyoudeclarewheretofindthedependenciesofyourprojectre

Hadoop MapReduce : Custom Input Format

我有一个文件,其中包含文本和“^”之间的数据:一些文字^在这里^还有一些^更多到这里我正在编写自定义输入格式以使用“^”字符分隔行。即映射器的输出应该是这样的:一些文字去这里还有一些更多内容在这里我编写了一个扩展FileInputFormat的自定义输入格式,还编写了一个扩展RecordReader的自定义记录阅读器。下面给出了我的自定义记录阅读器的代码。我不知道如何处理这段代码。在WHILE循环部分使用nextKeyValue()方法时遇到问题。我应该如何从拆分中读取数据并生成自定义键值?我正在使用所有新的mapreduce包而不是旧的mapred包。publicclassMyRec