草庐IT

SQOOP_CONF_DIR

全部标签

java - 启动 Sqoop2 server (1.99.7) 时无法找到 hadoop 配置类

我正在测试将Hadoop与最新版本的Sqoop2(1.99.7)结合使用,并且在运行sqoop2-server时,出现以下错误:Exceptioninthread"main"java.lang.NoClassDefFoundError:org/apache/hadoop/conf/Configurationatorg.apache.sqoop.security.authentication.SimpleAuthenticationHandler.secureLogin(SimpleAuthenticationHandler.java:36)atorg.apache.sqoop.secu

mysql - 我如何查看 sqoop 作业中的增量更新值?

下面是我创建的sqoop作业sqoopjob--createsqoop_incremental_job--import--connectjdbc:mysql://quickstart.cloudera:3306/retail_db--usernameretail_dba--passwordcloudera--tablecategories--target-dir/user/cloudera/sqoop_incremental_job_categories--incrementalappend--check-columncategory_id--last-value10-m1例如:最后一

hadoop - Sqoop 导入 hive 数据库不会发生在/user/hive/warehouse

我已经安装了hadoop2.7.2,同时尝试使用下面的sqoop命令将数据导入到配置单元表中,为什么它试图插入到/user/root/而不是插入到/user/hive/warehousesqoopimport-all-tables\--num-mappers1\--connect"jdbc:mysql://localhost:3306/retail_db"\--username=root\--password=root\--hive-import\--hive-overwrite\--hive-databasesqoop_import\--create-hive-table

oracle - 调整 sqoop 导出性能

我正在使用AWSEMR上的sqoop将20亿条记录从配置单元导出到Oracle数据库。我已经尝试了--batch和--num-mappers参数,它们已经帮助提高了性能。调整-Dsqoop.export.statements.per.transaction和-Dsqoop.export.records.per.statement有帮助吗?期待有关提高导出吞吐量的其他调整参数的建议。 最佳答案 您是否尝试包含--direct选项?我已经看到这会提高Oracle导入的性能,具体取决于您的oracle版本。

hadoop - 增量 sqoop 到 HIVE 表

众所周知,--incrementalsqoop导入开关不适用于通过SQOOP导入的HIVE。但是解决方法是什么?1)我可以弥补的一件事是我们可以创建一个HIVE表,并通过SQOOP将增量数据带到HDFS,然后手动加载它们。但如果我们这样做,每次加载时,数据都会被覆盖。如果我错了,请纠正我。2)sqooping数据到HIVE时--query的效果如何?谢谢 最佳答案 您可以对hive表执行sqoop增量追加,但没有直接的选项,下面是您可以实现它的方法之一。将增量表作为外部表存储在Hive中。更常见的是导入自上次数据更新以来的增量更改,

mysql - sqoop导入错误

我正在使用sqoop1.4.6。执行以下sqoop导入命令时出现错误:sqoopimport--connectjdbc:mysql://localhost/movielens--drivercom.mysql.jdbc.Driver--tablemovies-m1ERRORmanager.SqlManager:Errorexecutingstatement:java.sql.SQLException:Accessdeniedforuser''@'localhost'(usingpassword:NO)java.sql.SQLException:Accessdeniedforuser''

oracle - 是否可以使用 sqoop 导入表并添加额外的时间戳列?

是否可以使用sqoop命令“导入表”将表从oracle数据库导入到Hadoop集群并添加一个带有当前时间戳的额外列(用于故障排除目的)?到目前为止,我有以下命令:sqoopimport-Dorg.apache.sqoop.splitter.allow_text_splitter=true--connectjdbc:oracle:thin:@//MY_ORACLE_SERVER--usernameUSERNAME--passwordPASSWORD--target-dir/MyDIR--fields-terminated-by'\b'--tableSOURCE_TABLE--hive-t

hadoop - Sqoop:--as-parquetfile 不工作

我想将sqoop文件作为parquet文件直接保存到hdfs。我正在尝试执行以下命令。但面对ERRORsqoop.Sqoop:GotexceptionrunningSqoop:java.lang.NullPointerExceptionsqoop版本-1.4.7sqoopimport--options-file/home/user/optionsfile.txt--query"select*fromtablewhere\$CONDITIONS"--target-dir'hdfs:///user/x/sqoop1'--as-parquetfile-m1;当我在没有--as-parquet

java - 从hadoop中的作业conf获取输入路径

我正在设置一个路径作为conf的输入位置FileInputFormat.setInputPaths(conf,newPath("path/to/folder"));当我尝试实现自己的RecordReader时,如何从conf中取回这个位置提前致谢... 最佳答案 此调用设置的属性是map.input.dir,因此这应该适合您:conf.get("map.input.dir");附带说明一下,您的记录阅读器应该根据initialize(InputSplit,TaskAttemptContext)方法中给出的输入拆分进行操作,因为您在s

sql-server - 从 SQL Server 导入时,sqoop 是否获取任何锁?

我正在使用sqoop从SQLServer导入到HDFS。我想知道是否在我从中导入的表上获得了任何锁,如果是,是否有一种方法可以执行与WITH(NOLOCK)等效的操作? 最佳答案 是的,根据SQOOP-724。这里,还包括一个示例http://mail-archives.apache.org/mod_mbox/sqoop-user/201302.mbox/%3CCAL=o-uTG3Pwrtd+brF9q+b6zEZUSnJ9Z35BYRrsvNr1gi1pxXA@mail.gmail.com%3E