草庐IT

SQOOP_CONF_DIR

全部标签

hadoop - SQOOP 从 Teradata 导入 : Create table Ok but without data

我使用sqoop通过我的TD数据库拨号。当我尝试这个时,一切正常(我的表是在默认配置单元数据库中创建的)sqoopimport\-libjars$LIB_JARS\-Dteradata.db.input.job.type=hive\-Dteradata.db.input.target.table=hive_table\-Dteradata.db.input.target.table.schema="c1bigint"\-m1\--connectjdbc:teradata://PRD/Database=database\--connection-managerorg.apache.sqo

hadoop - 如何修改 Hue 的 Sqoop 应用程序的规范导入示例,使其可重新运行?

我已经尝试了hue的sqoop应用程序的规范导入示例-看起来像这样:http://blog.cloudera.com/blog/2013/11/sqooping-data-with-hue/然而,这个例子是不可重复的——在第二次和以后的运行尝试中,它会给出一条错误消息(sqoop不会覆盖现有目录的内容——所以一旦在原始导入期间创建了目录,它就拒绝运行).我如何修改此示例,使导入过程可调度/可重新运行? 最佳答案 此示例使用Sqoop2,OozieWorkflows还不支持Sqoop2Action,只支持Sqoop1。解释了一些解决方

hadoop - 如何更改 hadoop conf 目录位置?

在异常堆栈跟踪中,我可以看到我的hadoop配置是从/etc/hadoop/conf.empty/hdfs-site.xml加载的如何将其更改为/etc/hadoop/conf/hdfs-site.xml? 最佳答案 原则上,您可以在加载hadoop守护程序之前加载任何bash脚本,例如在/etc/init.d/hadoop-hdfs-datanode中用于数据节点。你可以在这个init脚本的顶部添加,exportHADOOP_CONF_DIR=/etc/hadoop/conf此外,您可以在/usr/lib/hadoop/etc/h

hadoop - 我如何使用 sqoop 从 HDFS 导入并在导入时合并表的两列?

我可以在导入或导出时合并两列或多列吗?假设我在DBMSID、FIRST_NAME、LAST_NAME中有3列,我想将其加载为ID、NAME只有两列。那我该怎么做呢? 最佳答案 试试下面的选项sqoopimport--connect--username--password--query"selectID,CONCAT(FIRST_NAME,LAST_NAME)fromtable"--target-dir因为你没有提到你的数据库和表名,所以我用通用形式写了。 关于hadoop-我如何使用sq

java - 从 sql server 导入数据的 Sqoop 作业忽略模式

如何将模式名称传递给sqoop作业,将数据从SQLServer导入到hdfs?sqoopjob--createjob_name--import--connect"jdbc:sqlserver://server:port;database=datatabase_name;username=user;password=password"--tablesource_table--as-avrodatafile--target-dirdata/target_folder----schemaschema_name当我使用执行作业时sqoopjob-execjob_name生成的查询缺少架构名称。

mysql - Sqoop - 如果使用 order by 和 limit 1,则导入最大值查询失败

我有一个简单的Sqoop查询,我用它来导入表ID的最大值并将其存储在HDFS中。存储在HDFS中是客户要求的,所以出于多种原因我要这样做。为了得到我用过的最大值sqoopimport\--connectjdbc:mysql://abc.com/sqoopemp\--usernameroot\--passwordroot\--e'selectmax(id)fromempWHERE$CONDITIONS'\--target-dirsqooplastmax\--m1\--drivercom.mysql.jdbc.Driver上面的查询给了我所需的答案,但出于性能原因,我正在考虑使用以下内容s

hadoop - strace'ing sqoop 命令时资源暂时不可用 futex

我有一个sqoop命令,它使用hcatalog参数将数据从Oracle导入到hiveorc表中。sqoopimport-Doraoop.disabled=true-Dmapred.child.java.opts="\-Djava.security.egd=file:/dev/../dev/urandom"--connect'jdbc:oracle:thin:@(DESCRIPTION=(ADDRESS=(PROTOCOL=TCP)(HOST=dbs-dev-v.com)(PORT=1533))(CONNECT_DATA=(SERVICE_NAME=SDADCOM)(Server=Ded

hadoop - Apache Sqoop 是否支持从 HIVE 到 Cassandra 的数据传输。

这些(Hive/Cassandra)都不是关系型的。Hive受JDBC支持,我认为与Hive兼容。 最佳答案 您说得对Sqoop与JDBC一起工作。例如,使用ProgressJDBCdriver,您可以从Sqoop按如下方式从HDFS导出到Cassandra:sqoopexport--connect'jdbc:datadirect:cassandra://MyServer:9042;KeyspaceName=MyKS'--drivercom.ddtek.jdbc.cassandra.CassandraDriver--table'bl

oracle - SQOOP输出文件大小不均匀

我有一个庞大的新闻数据库,但每当我尝试对其进行sqoop时,它都会写入2-3个文件,而不是整个200个文件。sqoopimport-Dmapred.map.max.attempts=4\-Ddfs.blocksize=1073741824\-Doraoop.block.allocation=RANDOM\-Dmapred.job.queue.name=default\-m200\--split-byAUTHOR_ID\--connectjdbc:oracle:thin:@$127.0.0.1:1521:SRDB\--usernameabc\--password1234\--tableL

mysql - sqoop导出mysql分区

我正在尝试使用sqoop从分区的配置单元表导出到mysql。起初我尝试做$sqoopexport--connectjdbc:mysql:///--username-P--tablesource_edge_daily--export-dir/path/to/table/--input-fields-terminated-by'\t'--verbose命令错误说Openfailedforfile/path/to/table//,attempttoopenadirectory当我指向分区目录时$sqoopexport--connectjdbc:mysql:///--username-P--t