Sqoop

hadoop - Sqoop 导入 hive 数据库不会发生在/user/hive/warehouse

我已经安装了hadoop2.7.2，同时尝试使用下面的sqoop命令将数据导入到配置单元表中，为什么它试图插入到/user/root/而不是插入到/user/hive/warehousesqoopimport-all-tables\--num-mappers1\--connect"jdbc:mysql://localhost:3306/retail_db"\--username=root\--password=root\--hive-import\--hive-overwrite\--hive-databasesqoop_import\--create-hive-table

oracle - 调整 sqoop 导出性能

我正在使用AWSEMR上的sqoop将20亿条记录从配置单元导出到Oracle数据库。我已经尝试了--batch和--num-mappers参数，它们已经帮助提高了性能。调整-Dsqoop.export.statements.per.transaction和-Dsqoop.export.records.per.statement有帮助吗？期待有关提高导出吞吐量的其他调整参数的建议。最佳答案您是否尝试包含--direct选项？我已经看到这会提高Oracle导入的性能，具体取决于您的oracle版本。

oracle sqoop section code strong hadoop export performance-testing

hadoop - 增量 sqoop 到 HIVE 表

众所周知，--incrementalsqoop导入开关不适用于通过SQOOP导入的HIVE。但是解决方法是什么？1)我可以弥补的一件事是我们可以创建一个HIVE表，并通过SQOOP将增量数据带到HDFS，然后手动加载它们。但如果我们这样做，每次加载时，数据都会被覆盖。如果我错了，请纠正我。2)sqooping数据到HIVE时--query的效果如何？谢谢最佳答案您可以对hive表执行sqoop增量追加，但没有直接的选项，下面是您可以实现它的方法之一。将增量表作为外部表存储在Hive中。更常见的是导入自上次数据更新以来的增量更改，

hadoop sqoop section incremental hive

mysql - sqoop导入错误

我正在使用sqoop1.4.6。执行以下sqoop导入命令时出现错误:sqoopimport--connectjdbc:mysql://localhost/movielens--drivercom.mysql.jdbc.Driver--tablemovies-m1ERRORmanager.SqlManager:Errorexecutingstatement:java.sql.SQLException:Accessdeniedforuser''@'localhost'(usingpassword:NO)java.sql.SQLException:Accessdeniedforuser''

mysql sqoop jdbc SQLError hadoop

oracle - 是否可以使用 sqoop 导入表并添加额外的时间戳列？

是否可以使用sqoop命令“导入表”将表从oracle数据库导入到Hadoop集群并添加一个带有当前时间戳的额外列(用于故障排除目的)？到目前为止，我有以下命令:sqoopimport-Dorg.apache.sqoop.splitter.allow_text_splitter=true--connectjdbc:oracle:thin:@//MY_ORACLE_SERVER--usernameUSERNAME--passwordPASSWORD--target-dir/MyDIR--fields-terminated-by'\b'--tableSOURCE_TABLE--hive-t

oracle sqoop section hive hadoop timestamp

hadoop - Sqoop:--as-parquetfile 不工作

我想将sqoop文件作为parquet文件直接保存到hdfs。我正在尝试执行以下命令。但面对ERRORsqoop.Sqoop:GotexceptionrunningSqoop:java.lang.NullPointerExceptionsqoop版本-1.4.7sqoopimport--options-file/home/user/optionsfile.txt--query"select*fromtablewhere\$CONDITIONS"--target-dir'hdfs:///user/x/sqoop1'--as-parquetfile-m1;当我在没有--as-parquet

as-parquetfile parquetfile section sqoop hadoop sqoop2

sql-server - 从 SQL Server 导入时，sqoop 是否获取任何锁？

我正在使用sqoop从SQLServer导入到HDFS。我想知道是否在我从中导入的表上获得了任何锁，如果是，是否有一种方法可以执行与WITH(NOLOCK)等效的操作？最佳答案是的，根据SQOOP-724。这里，还包括一个示例http://mail-archives.apache.org/mod_mbox/sqoop-user/201302.mbox/%3CCAL=o-uTG3Pwrtd+brF9q+b6zEZUSnJ9Z35BYRrsvNr1gi1pxXA@mail.gmail.com%3E

入时 sql-server section sqoop mail hadoop locking hdfs

hadoop - SQOOP 从 Teradata 导入 : Create table Ok but without data

我使用sqoop通过我的TD数据库拨号。当我尝试这个时，一切正常(我的表是在默认配置单元数据库中创建的)sqoopimport\-libjars$LIB_JARS\-Dteradata.db.input.job.type=hive\-Dteradata.db.input.target.table=hive_table\-Dteradata.db.input.target.table.schema="c1bigint"\-m1\--connectjdbc:teradata://PRD/Database=database\--connection-managerorg.apache.sqo

Teradata without section database Dteradata hadoop import hive sqoop

hadoop - 如何修改 Hue 的 Sqoop 应用程序的规范导入示例，使其可重新运行？

我已经尝试了hue的sqoop应用程序的规范导入示例-看起来像这样:http://blog.cloudera.com/blog/2013/11/sqooping-data-with-hue/然而，这个例子是不可重复的——在第二次和以后的运行尝试中，它会给出一条错误消息(sqoop不会覆盖现有目录的内容——所以一旦在原始导入期间创建了目录，它就拒绝运行).我如何修改此示例，使导入过程可调度/可重新运行？最佳答案此示例使用Sqoop2，OozieWorkflows还不支持Sqoop2Action，只支持Sqoop1。解释了一些解决方

hadoop Sqoop section noreferrer noopener cloudera hue

hadoop - 我如何使用 sqoop 从 HDFS 导入并在导入时合并表的两列？

我可以在导入或导出时合并两列或多列吗？假设我在DBMSID、FIRST_NAME、LAST_NAME中有3列，我想将其加载为ID、NAME只有两列。那我该怎么做呢？最佳答案试试下面的选项sqoopimport--connect--username--password--query"selectID,CONCAT(FIRST_NAME,LAST_NAME)fromtable"--target-dir因为你没有提到你的数据库和表名，所以我用通用形式写了。关于hadoop-我如何使用sq

入时 hadoop section NAME stackoverflow hdfs sqoop sqoop2

28 29 303132 33 34