草庐IT

sqoop-sha

全部标签

java - 来自 Java 程序的 Sqoop

我已经阅读了有关在Java程序中使用Sqoop的问题here,here和here.我想到了以下内容,但我被ClassNotFoundException难住了:importorg.apache.hadoop.conf.Configuration;importorg.apache.hadoop.fs.*;importcom.cloudera.sqoop.SqoopOptions;importcom.cloudera.sqoop.SqoopOptions.FileLayout;importcom.mysql.jdbc.*;publicclassSqoopExample{publicstati

oracle - 异常 : Job Failed with status:3 when copying data from Oracle to HDFS through sqoop2

我正在尝试使用Sqoop2将数据从Oracle11g2服务器复制到HDFS。Oracle的链接似乎有效,因为如果我使用无效的凭据,它会提示。定义如下:linkwithid14andnameOLink(Enabled:true,Createdbyxxxat2/9/162:48PM,Updatedbyxxxat2/11/1610:08AM)UsingConnectorgeneric-jdbc-connectorwithid4LinkconfigurationJDBCDriverClass:oracle.jdbc.driver.OracleDriverJDBCConnectionString

hadoop - 如何使用 sqoop 作业自动化 sqoop 增量导入?

如何使用sqoopjob自动化sqoop增量导入?据我所知,sqoopjob会记住最后一个值。如果我们创建一个类似的sqoop作业sqoopjob--createmyjob--import--connectblahblah..sqoop执行我的作业并使作业自动化,它会在每次执行时创建作业。所以,我们会得到工作已经存在的错误。那么,是否可以使用sqoopjob自动执行sqoop增量导入?请告诉我您对此的了解。提前致谢。 最佳答案 为了重述的可能性,最好完全控制书签。这就是自定义机制优于sqoop作业的原因。工作流模板是:阅读最新书签。

hadoop - 无法使用oozie运行sqoop

当我从CLI运行以下sqoop命令时,我能够将数据导出到OracleDB,但是当我使用oozie工作流运行相同的命令时,我遇到了问题。直接从CLI运行的命令:sqoopexport--connectjdbc:oracle:thin:@192.168.245.1:1521:XE--usernameHR--passwordHR--tableHR.REVIEW_FINAL--export-dir/user/cloudera/Review/hive/review_final--input-fields-terminated-by'\001'以下是我通过Oozie使用的内容:export--co

mysql - Oozie - 运行 sqoop : Could not load db driver class: com. mysql.jdbc.Driver 时出现异常

我正在尝试通过Oozie在HDP沙箱2.1上执行sqoop导出。当我运行Oozie作业时,出现以下Java运行时异常。'>>>InvokingSqoopcommandlinenow>>>7598[main]WARNorg.apache.sqoop.tool.SqoopTool-$SQOOP_CONF_DIRhasnotbeensetintheenvironment.Cannotcheckforadditionalconfiguration.7714[main]INFOorg.apache.sqoop.Sqoop-RunningSqoopversion:1.4.4.2.1.1.0-385

hadoop - Sqoop 自由格式查询在 Hue/Oozie 中导致无法识别的参数

我正在尝试运行带有自由格式查询的sqoop命令,因为我需要执行聚合。它作为Oozie工作流通过Hue界面提交。以下是命令和查询的缩小版本。处理命令时,“--query”语句(用引号括起来)导致查询的每个部分都被解释为无法识别的参数,如命令后的错误所示。此外,目标目录被误解。是什么阻止了它运行,如何解决它?${env}和${shard}变量正在被正确解析,如上一条错误消息所示。谢谢!===========import--connectjdbc:mysql://irbasedw-${shard}.db.xxxx.net:3417/irbasedw_${shard}?dontTrackOpe

hadoop - HDP 2.2 沙箱找不到 SQOOP 目录

我正在学习教程http://hortonworks.com/hadoop-tutorial/import-microsoft-sql-server-hortonworks-sandbox-using-sqoop/我无法找到/usr/lib/sqoop/lib。我可以看到Sqoop在沙箱中运行。只是找不到要删除驱动程序的文件夹。我还能在哪里放置jdbc驱动程序?还有sqoop的安装目录在哪里? 最佳答案 它在/usr/hdp/2.2.0.0-2041/sqoop/lib 关于hadoop-

hadoop - 如何给 Sqoop 输出文件自定义名称

当我默认使用sqoop将数据导入配置单元时,它会在HDFS上创建文件名为part-m-0000、part-m-0001等。是否可以重命名这些文件?如果我想给一些有意义的名字,比如在文件名后加上日期来指示加载,我该怎么做呢?请推荐 最佳答案 不能直接用sqoop做,但是可以在sqoop导入完成后在HDFS中重命名:today=`date+%Y-%m-%d`files=$(hadoopfs-ls/path-to-files|awk'{print$8}')forfin$files;dohadoopfs-mv$f$f$today;done第

java - 我正在尝试通过 java 编程将 Sqoop 从 oracle 导入到 hdfs

我正在使用ssh来执行Sqoop命令。这是我的代码的引用HowtouseSqoopinJavaProgram?但我收到“找不到sqoop命令”的错误。这是代码packagesqoop;importnet.neoremind.sshxcute.core.Result;importnet.neoremind.sshxcute.core.SSHExec;importnet.neoremind.sshxcute.core.ConnBean;importnet.neoremind.sshxcute.task.CustomTask;importnet.neoremind.sshxcute.task

mysql - sqoop 从 mysql 导入配置单元,用户名被更改(拒绝用户访问)

我正在尝试通过sqoop将一些数据从mysql导入到hive。当sqoop和mysqldb在同一台主机上时它工作,否则失败。这是我正在执行的查询。[user@xyz~]$sqoopimport--connect"jdbc:mysql://abc.something.com/test"--usernameuser--passwordpass--tabledataSql--hive-import--hive-tabletest.dataHive--target-dir/tmp/sqoop$RANDOM请注意,我目前在主机xyz上,我正在尝试连接到主机abc上的mysql数据库。以下是我看到