草庐IT

mysql - 使用 Oozie 永远运行的 Sqoop 作业

我们有两个节点的hadoopyarn集群,它是hadoop2.2,在其上我们使用oozie在单个工作流中安排了两个操作,第一个操作是pythonmap-reduce流操作,第二个是sqoopexport作业,它实际上是将map-reduce流操作的输出传输到mysql数据库。流式操作成功执行,导致sqoop作业启动,并一直运行。stdout结果如下。Sqoopcommandarguments:export--connectjdbc:mysql://localhost/database--usernameroot--passwordroot--tabletableName--direct

hadoop - Sqoop 从 Hive 导出到 Teradata 时间戳格式必须是 yyyy-mm-dd hh :mm:ss[. ffffffff]

我正在尝试将数据从HadoopHive导出到Teradata。我的数据包含可以为NULL的时间戳。当我进行导出时,对于具有NULL时间戳的行,我收到以下错误:“时间戳格式必须是yyyy-mm-ddhh:mm:Ss[.fffffffff]”在我的sqoop导出中,我确实添加了两个选项--input-null-string'\N'和--input-null-non-string'\N'。你知道解决这个问题的方法吗?谢谢。 最佳答案 Teradata中数据类型为timestamp的列需要具有以下格式的值yyyy-mm-ddhh:mm:Ss

hadoop - Oozie 无法在 Sqoop 中找到 JDBC 驱动程序

引用之前问的问题Oozie+Sqoop:JDBCDriverJarLocation1但无法在HDFS/user/oozie/share/lib/sqoop位置找到jar。我还尝试将驱动程序jar放在我的workFlow应用程序库中。仍未找到驱动程序错误发生。 最佳答案 您需要在sqoop文件夹内的oozie共享lib文件夹中添加所有lib文件,如jdbc驱动程序等。这应该可以解决您的问题。要检查作业调用/使用的库文件,请转到相应作业的作业跟踪器,在系统日志中您将看到哪些所有jars已被使用。

hadoop - 在 sqoop 1.99.4 上设置 linkConfig.connectionString 时出错

我关注了https://sqoop.apache.org/docs/1.99.4/RESTAPI.html用于试用sqoop2。但我在linkConfig.getStringInput("linkConfig.connectionString").setValue行收到错误“线程“主”中的异常org.apache.sqoop.common.SqoopException:MODEL_011:输入不存在-输入名称:linkConfig.connectionString”("jdbc:mysql://localhost/my");我从终端测试了sqoop2、mysql、数据库等,工作正常。请

database - sqoop如何处理SQL Server DB锁?

关于从MicrosoftSQLServer将数据导入sqoop的主题。sqoop在运行importtable命令时如何处理数据库锁?更多信息:Sqoop正在使用JDBC驱动程序。 最佳答案 Sqoop通过获取所需的锁并尊重其他进程获取的冲突锁来处理数据库锁。和其他人一样。你到底在担心什么?Sqoop执行普通的INSERT操作。 关于database-sqoop如何处理SQLServerDB锁?,我们在StackOverflow上找到一个类似的问题: https

oracle - 使用 sqoop 从 Oracle 到 hive 的日期导入问题

我正在尝试将数据从Oracle导入到配置单元。Oracle“LOAD_DATE”中有一列,其值的格式为“8/13/20152:55:17AM”。导入后,我得到的值类似于“2015-08-1302:55:17.0”。导入的数据中缺少“AM”。请给出导入正确数据的解决方案。这是我正在触发的命令,sqoopimport--connectjdbc:oracle:thin:@ipaddr/dbname--usernameuname--passwordpword--tabletname--hive-import--hive-tabledbname.tname-m1--null-字符串'\N'--n

hadoop - Sqoop从voltdb导出数据

我正在尝试将数据从votldb表导入配置单元,这是我正在使用的命令sqoopimport--connectjdbc:voltdb://:--driverorg.voltdb.jdbc.Driver--password--username--table--hive-database--hive-overwrite--create-hive-table--hive-import我遇到了以下错误ERRORsqoop.Sqoop:GotexceptionrunningSqoop:java.lang.RuntimeException:Couldnotloaddbdriverclass:org.v

hadoop - sqoop-导出分区的Hive表

我有一个按year和week列分区的Hive表。因此内容存储在Hive仓库的多个递归目录中,在我的例子中,我有超过100个目录(分区)用于此表。在这里,我不确定如何将hive表的目录详细信息提及到sqoop-export命令的--export-dir属性。我是否必须在单独的sqoop-export命令中单独提及所有100*目录?有没有办法在单个sqoop-export命令中提及所有嵌套目录?请告诉我是否还有其他更好的方法来解决这个问题?[注意:我的环境中没有Hcatalog,我只想将“导出到hdfs目录”作为我的最后一个选项] 最佳答案

hadoop - Sqoop + S3 + Parquet 导致 Wrong FS 错误

尝试使用Sqoop将Parquet格式的数据导入S3时,如下:bin/sqoopimport--connect'jdbc:[conn_string]'--table[table]--target-dirs3a://bucket-name/--hive-drop-import-delims--as-parquetfile...我收到以下错误:ERRORtool.ImportTool:ImportedFailed:WrongFS:s3a://bucket-name/,expected:hdfs://localhost:9000我在导入非parquet数据或直接通过HDFS使用s3a时没有问

hadoop - oozie - sqoop $SQOOP_CONF_DIR 尚未在环境中设置

我正在尝试使用oozie(霍顿作品)运行sqoop。这是我第一次尝试运行oozie工作流,但出现以下错误InvokingSqoopcommandlinenow1811[main]WARNorg.apache.sqoop.tool.SqoopTool-$SQOOP_CONF_DIRhasnotbeensetintheenvironment.Cannotcheckforadditionalconfiguration.2015-12-2116:58:45,913WARN[main]tool.SqoopTool(SqoopTool.java:loadPluginsFromConfDir(177