草庐IT

jdbc_driver_library

全部标签

java - hadoop: sqoop- 为什么 jdbc 代码是用 reducer 写的?

我是hadoop及其生态系统的新手。Sqoop:从/向hdfs-RDBMS导入/导出数据。Sqoop兼容JDBC相关数据库。为什么在从/到hdfs-RDBMS导入和导出数据时,所有的jdbc代码都写在reducer而不是mappers中?有人说要避免Ddos(分布式拒绝服务)。 最佳答案 Sqoop中没有reducer。Sqoop只需要用于导入和导出的映射器。为了将数据从RDBMS导入HadoopSqoop具有使用JDBC从数据库获取数据的输入格式。同样,sqoop具有用于写入数据的输出格式从Hadoop导出数据到RDBMS

hadoop - Oozie 无法在 Sqoop 中找到 JDBC 驱动程序

引用之前问的问题Oozie+Sqoop:JDBCDriverJarLocation1但无法在HDFS/user/oozie/share/lib/sqoop位置找到jar。我还尝试将驱动程序jar放在我的workFlow应用程序库中。仍未找到驱动程序错误发生。 最佳答案 您需要在sqoop文件夹内的oozie共享lib文件夹中添加所有lib文件,如jdbc驱动程序等。这应该可以解决您的问题。要检查作业调用/使用的库文件,请转到相应作业的作业跟踪器,在系统日志中您将看到哪些所有jars已被使用。

java - Hive jdbc 驱动程序以非描述性消息响应

我准备了使用hivejdbc客户端调用HadoopDB的java应用程序。当我尝试做简单的查询时,比如“select*fromstudents”,它工作正常。但是一旦我添加了一些条件语句(例如,whereage>10),它就会开始响应异常,如下所示:Causedby:java.sql.SQLException:Queryreturnednon-zerocode:2,cause:FAILED:ExecutionError,returncode2fromorg.apache.hadoop.hive.ql.exec.mr.MapRedTaskatorg.apache.hadoop.hive.

hadoop - Hive JDBC 中的无效 URL

WheninHive关于通过JDBCHive连接Exceptioninthread"main"java.sql.SQLException:InvalidURL:jdbc:hive2://192.168.14.52:10000/reportatorg.apache.hadoop.hive.jdbc.HiveConnection.(HiveConnection.java:85)atorg.apache.hadoop.hive.jdbc.HiveDriver.connect(HiveDriver.java:104)atjava.sql.DriverManager.getConnection(

java - Hive jdbc.query(sql, rowmapper) 抛出 UnCatogarized 异常

我正在使用spring-jdbc模板来查询Hive-0.11.0以下代码效果很好。publicListlistStudents(){StringSQL="select*fromStudent";Liststudents=jdbcTemplateObject.query(SQL,newStudentMapper());returnstudents;}publicclassStudentMapperimplementsRowMapper{publicStudentmapRow(ResultSetrs,introwNum)throwsSQLException{Studentstudent=n

hadoop - Hive ql Driver如何指定默认以外的数据库名称

我正在编写一个示例程序,使用org.apache.hadoop.hive.ql.Driver类连接到HiveMetastore。示例片段如下StringuserName="test";HiveConfconf=newHiveConf(SessionState.class);conf.set("fs.default.name","hdfs://"+hadoopMasterHost+":8020");conf.set("hive.metastore.local","false");conf.set("hive.metastore.warehouse.dir","/user/hive/war

hadoop - Hadoop中如何将Mapper的值上报给Driver程序?

我有一个hadoop程序,我想在映射器末尾向驱动程序报告一个值。因此,在驱动程序中我有多个值,每个值都来自映射器然后我想获得值之间的最大值。我正在使用Counter对其进行编码,这是我拥有的代码:protectedvoidcleanup(Contextcontext){....context.getCounter("TimeStamps","Max").setValue(value);}在我的驱动程序中CounterGroupcounters=job.getCounters().getGroup("TimeStamps");Iteratoriter=counters.iterator(

java - 使用jdbc在hive中插入map等复杂类型

我有一个java映射(Map)和一个到配置单元服务器的JDBC连接。服务器上表的架构包含一个Map类型的列。是否可以使用JDBC将javaMap插入到具有相似数据类型的hive表列?我试过:"createtabletest(keystring,valueMap)""insertintotabletestvalues('keywer',map('subkey','subvalue'))fromdummylimit1;"引用:Hiveinsertingvaluestoanarraycomplextypecolumn但插入失败:"Error:Errorwhilecompilingstatem

mysql - Spark : Exception in thread "main" java. lang.ClassNotFoundException : com. mysql.jdbc.Driver

我在spark中编写了一个简单的程序来将数据帧写入mySql中的表。程序如下:importorg.apache.spark.SparkConfimportorg.apache.spark.SparkContextimportorg.apache.spark.rdd.RDDimportorg.apache.spark.sql.SQLContextimportorg.apache.spark.sql.hive.HiveContextimportorg.apache.spark.SparkContext._importorg.apache.spark.rdd._//importorg.apa

java - 无法从 Web 应用程序通过 JDBC 连接到 HIVE

我已经使用JDBCapi连接到HIVE2,引用here,它是成功的,所以为了便于访问,我想围绕它创建一个webapp,使用JSP作为前端页面来输入服务器名称和查询。虽然所有参数都从JSP页面正确解析为servlet,但它在连接到所需的HIVE服务器时抛出错误将libthrift和hiveJARS放在WEB-INF/lib目录中,我将其放在WEB-INF/lib和类路径中。问题是因为hivejar首先出现在WEB-INF/lib中,并且因为它没有“org.apache.thrift.protocol.TProtocol.getScheme()”方法,所以我一直没有收到这样的方法错误。我提