草庐IT

hadoop - 在 Oozie 编辑器 (Hue) 中使用 Sqoop 操作时出错

我正在尝试在Hue的Oozie编辑器中使用Sqoop操作,但是我无法让它工作。这是我到目前为止尝试过的方法。我将所有内容都放在参数中,而不是命令(http://alvincjin.blogspot.com.au/2014/06/create-sqoop-action-in-oozie-using-hue.html)此外,我正在尝试连接到Teradata,因此我将jdbcjar放在HDFS中,并将它们添加到文件中。这是当前工作流程在编辑器中的样子:SqoopAction.工作流定义是:Actionfailed,errormessage[${wf:errorMessage(wf:lastE

hadoop - Sqoop-2 在使用 sqoop shell 进行自定义查询时无法对单个节点进行大量导入

我正在对由计算量大的自定义查询生成的大型记录集进行原型(prototype)迁移。此查询大约需要1-2小时才能在SQLDeveloper中返回结果集我正在尝试将此查询传递给一个简单的Sqoop作业,其中包含JDBC到HDFS的链接我在日志中遇到了以下错误:2016-02-1210:15:50,690ERRORmr.SqoopOutputFormatLoadExecutor[org.apache.sqoop.job.mr.SqoopOutputFormatLoadExecutor$ConsumerThread.run(SqoopOutputFormatLoadExecutor.java:

hadoop - sqoop 从 netezza 失败 - "java.lang.ArrayIndexOutOfBoundsException"

我正在努力调试/理解为什么我的sqoop命令在Netezza数据库中失败。我已经对许多其他表使用了基本相同的sqoop命令,没有任何问题。特别是这个源表没有任何出乎意料的数据类型,全是nvarchar、nchar、integer、timestamp等。这里是指定的sqoop命令:sqoopimport\--connectjdbc:netezza://netezza-host-name:5480/nzdatabase\--usernameuser\--passwordsecret\--tablesource_table_name\--as-sequencefile\--hive-drop

hadoop - 如何使用sqoop覆盖hive中的数据

我正在尝试通过sqoop从mysql数据库将数据加载到配置单元中已经存在的表中。我指的是以下指南以供引用:-http://sqoop.apache.org/docs/1.4.5/SqoopUserGuide.html#_importing_data_into_hive--hive-import已成功试用和测试。我创建了一个配置单元表如下:-createtablesqoophive(idint,namestring,locationstring)rowformatdelimitedfieldsterminatedby'\t'linesterminatedby'\n'storedastex

hadoop - Sqoop导入多个表但不是全部

我发现的所有搜索都显示了如何导入一个表或推荐导入所有表。如果我想从我的数据库中获取440个表中的35个怎么办?我可以只写一个命令并用逗号分隔表,还是必须将它放在脚本中并一遍又一遍地复制和粘贴命令并每次都更改表名?我想做的事情:echo"SqoopImport"--options-file${path}--tabletbl1,tbl2,tbl3\--target-dir${path}--m1\我担心我可能不得不做的事情:echo"SqoopImport"--options-file${path}--tabletbl1\--target-dir${path}--m1waitecho"Sqo

hadoop - 如何每天将增量记录从 Oracle 加载到 HDFS,我们可以使用 Sqoop 或 MR Jobs。哪个是首选方法

如何每天从Oracle加载增量记录到HDFS?我们可以使用Sqoop或MRJobs吗? 最佳答案 Sqoop正是为此目的而设计的,并且会导致MR作业完成复制数据的工作。有多种方法可以确定Oracle表中的新内容,例如使用表的ID,或者可能使用日期修改字段(如果有的话)。与Hadoop中的大多数东西相比,Sqoop相当简单。这是文档的链接——搜索“增量”或从第7.2.9节开始了解更多信息。http://sqoop.apache.org/docs/1.4.6/SqoopUserGuide.html仅供引用一旦您使其正常工作,请查看设计用

database - 我无法通过 sqoop 所有表在 sqoop 中导入数据

[cloudera@quickstart~]$**sqoopimport-all-tables-m=4--connect"jdbc:mysql://quickstart.cloudera:3306/retail_db"--username=retail_dba--password=cloudera--warehouse-dir=/user/cloudera/sqoop-import**Warning:/usr/lib/sqoop/../accumulodoesnotexist!Accumuloimportswillfail.Pleaseset$ACCUMULO_HOMEtotheroo

hadoop - 使用带有 Oozie 的 sqoop 观察重复项

我已经构建了一个sqoop程序,以便使用预构建的sqoop作业将数据从MySQL导入HDFS:sqoopjob-fs$driver_path-Dmapreduce.map.java.opts="-Duser.timezone=Europe/Paris"\--createjob_parquet_table--import-m$nodes_number\--connectjdbc:mysql://$server:$port/$database--username$username--password-file$pass_file\--target-dir$destination_dir--

hadoop - 运行 sqoop 导入时出错 - ERROR manager.OracleManager : Failed to rollback transaction

我正在使用sqoop将数据从oracledb加载到hive规范:CDH-5.5.1Sqoop1.4.2初始化:exportSQOOP_HOME=/opt/cloudera/parcels/CDH-5.5.1-1.cdh5.5.1.p0.11/lib/sqoopexportHIVE_HOME=/opt/cloudera/parcels/CDH-5.5.1-1.cdh5.5.1.p0.11/lib/hiveexportHADOOP_CLASSPATH=/opt/cloudera/parcels/CDH-5.5.1-1.cdh5.5.1.p0.11/lib/sqoop/lib/ojdbc7.

hadoop - 密码问题的 Sqoop 作业

Sqoop作业总是在CLI中提示输入密码。为了避免这种情况,据说应该将属性sqoop.metastore.client.record.password设置为true。但是到处都说我需要更改sqqop_site.xml中的这个值。无论如何我可以将这个值单独设置为一项工作。我尝试创建如下所示的作业,但sqoop无法创建它sqoopjob--createTEST-Dsqoop.metastore.client.record.password=true--import\--connectjdbc:netezza://xx.xxx.xx.xxx/database\--usernameuserna