草庐IT

jdbc_driver_library

全部标签

spark.driver.maxResultSize限制 Spark 驱动程序(driver)在向客户端返回结果时的最大大小

org.apache.kyuubi.KyuubiSQLException:org.apache.kyuubi.KyuubiSQLException:ErroroperatingExecuteStatement:org.apache.spark.SparkException:Jobabortedduetostagefailure:Totalsizeofserializedresultsof3tasks(1290.4MiB)isbiggerthanspark.driver.maxResultSize(1024.0MiB)atorg.apache.spark.scheduler.DAGSchedul

java - hive JDBC ThriftHive$Client.sendBase

我在Hadoop/hive上工作。我已经安装了hadoop和hive,它们在命令提示符下运行良好。我还创建了hive的MySQL元存储。我在hive-site.xml文件中定义了HIVE-DB数据库名称。同名数据库在MySQL中可用>HIVE-DB。但是在hive命令提示符上创建的表在mysql命令提示符中不可用。当我想创建一个配置单元jdbc连接然后得到以下错误..首先是我的程序创建一个jdbc连接packageaa;importjava.sql.Connection;importjava.sql.DriverManager;importjava.sql.ResultSet;impo

mysql - Oozie - 运行 sqoop : Could not load db driver class: com. mysql.jdbc.Driver 时出现异常

我正在尝试通过Oozie在HDP沙箱2.1上执行sqoop导出。当我运行Oozie作业时,出现以下Java运行时异常。'>>>InvokingSqoopcommandlinenow>>>7598[main]WARNorg.apache.sqoop.tool.SqoopTool-$SQOOP_CONF_DIRhasnotbeensetintheenvironment.Cannotcheckforadditionalconfiguration.7714[main]INFOorg.apache.sqoop.Sqoop-RunningSqoopversion:1.4.4.2.1.1.0-385

hadoop - 是否可以使用 spark 的 jdbc 驱动程序将 apache spark 与 jasper 集成?

我们想使用apachespark进行实时分析?我们目前使用hive/MR进行数据处理,使用mysqlsql存储聚合结果,使用jasper报告进行分析?由于mysql的可伸缩性问题,这种方法远非理想。我们正在探索apachespark在hdfs或cassandra之上运行,唯一的问题是是否有办法让spark与jasper服务器集成?如果不是,还有哪些其他UI选项可以与spark一起使用? 最佳答案 我找到了共享的答案和想法,如果你将hivemetastore与spark一起使用,你可以将RDD持久化为hive表,一旦你这样做了,任何使

hadoop - Pyspark Mac NativeCodeLoader : Unable to load native-hadoop library for your platform. .. 在适用的情况下使用内置 java 类

这会阻止PySpark在JupyterNotebook中正常运行。我知道原生hadoop库仅在*nix平台上受支持。该库不适用于Cygwin或MacOSX平台。我怎样才能正确安装PySpark以在我的Jupyter笔记本中运行 最佳答案 下载hadoop二进制文件(link)并将其放在您的主目录中(您可以根据需要选择不同的hadoop版本并相应地更改后续步骤)使用以下命令将文件夹解压缩到您的主目录中。tar-zxvfhadoop_file_name现在将exportHADOOP_HOME=~/hadoop-2.8.0添加到您的.ba

Hadoop 压缩 : "Loaded native gpl library" but "Failed to load/initialize native-lzo library"

在多次尝试为hadoop安装Lzo压缩后,我需要帮助,因为我真的不知道为什么它不起作用。我在CentOs6上使用hadoop1.0.4。我试过http://opentsdb.net/setup-hbase.html,https://github.com/kevinweil/hadoop-lzo和其他一些人,但我仍然遇到错误:13/07/0319:52:23信息lzo.GPLNativeCodeLoader:加载nativegpl库13/07/0319:52:23警告lzo.LzoCompressor:java.lang.NoSuchFieldError:workingMemoryBuf

java - 如何在 Hive JDBC 中禁用详细日志记录

有人知道如何禁用日志记录或降低HiveJDBC驱动程序的冗长程度吗?我正在使用hive-jdbc-0.8.1.jar并且我也在远程调试,因此,当查询一个巨大的数据集时,控制台消息的日志记录需要永远。我试图将我的log4java属性设置为仅错误级别:Propertieslog4jProperties=newProperties();log4jProperties.setProperty("log4j.rootLogger","DEBUG,myConsoleAppender");log4jProperties.setProperty("log4j.appender.myConsoleApp

java - hive-jdbc-__-standalone.jar 的正确位置是什么?

关于设置hive0.14的指南:http://www.ishaanguliani.com/content/hive-0140-setup-ubuntu提示如果出错:Logginginitializedusingconfigurationinjar:file:/usr/local/hive/lib/hive-common-0.14.0.jar!/hive-log4j.propertiesSLF4J:ClasspathcontainsmultipleSLF4Jbindings.遇到文件hive-jdbc-0.14.0-standalone.jar必须从$HIVE_HOME/lib/移出但是

hadoop - 为 YARN/Hadoop2 作业设置 LD_LIBRARY_PATH 或 java.library.path

我有一个HadoopFileSystem,它使用带有JNI的本地库。显然,我必须独立于当前执行的作业来包含共享对象。但是我找不到告诉Hadoop/Yarn应该在哪里寻找共享对象的方法。我使用以下解决方案部分成功,同时使用yarn启动wordcount示例。在启动资源和节点管理器时设置exportJAVA_LIBRARY_PATH=/path。这有助于资源和节点管理器,但实际的作业/应用程序失败了。在执行wordcount示例时打印LD_LIBRARY_PATH和java.library.path会产生以下结果。什么/logs/userlogs/application_x/contain

下载MySQL JDBC驱动的方法

说明java代码通过JDBC访问MySQL数据库,需要MySQLJDBC驱动。例如,下面这段代码,因为找不到JDBC驱动,所以执行会报异常:packagecom.thb;publicclassJDBCDemo{publicstaticvoidmain(String[]args)throwsClassNotFoundException{Stringdriver="com.mysql.jdbc.Driver";Class.forName(driver);}}新版本驱动jar包的名称跟老的版本不同例如,下载了8.2.0版本的驱动mysql-connector-j-8.2.0.jar,即以mysql-