草庐IT

hadoop - Sqoop 使用 Java 从 Mysql 导入到 Hadoop hdfs

我正在尝试使用Java从Mysql加载到HDFS。我的Hadoop版本2.7.2和Sqoop1.4.6。我收到以下异常ERRORsecurity.UserGroupInformation:PriviledgedActionExceptionas:xxxxcause:org.apache.hadoop.ipc.RemoteException:ServerIPCversion9cannotcommunicatewithclientversion416/11/1617:40:57ERRORtool.ImportTool:EncounteredIOExceptionrunningimportj

hadoop - 用于 sqoop 导入的 Oozie 工作流在 Amazon emr hue 中失败

我创建了一个oozie工作流来执行从mysql到hive系统的sqoop导入。我用于创建sqoop作业的Sqoop作业成功运行,但是当我尝试执行作业以从MySQL导入Hive时,它​​失败了。这里我附上了日志sqoop--hive-import(失败的sqoop操作所做的)分两步发生。首先将sqoop导入到HDFS目录(我的xml中引用了targetDir)。然后将此sqoop导入的输出移动并导入到Hive中。当我通过oozie运行我的sqoop作业时,我在targetDir中看到一个_SUCCESS文件,表明sqoop导入成功。只有后期(第2步)失败了。我以hue用户身份运行Oozi

java - Sqoop HBase 导入 : java. lang.NoSuchMethodError : org. apache.hadoop.hbase.HTableDescriptor.addFamily

我在Ubuntu14.04上将Hadoop作为伪分布式集群运行。我也安装了HBase,一切正常。现在我想使用Sqoop的“导入”命令将数据从我本地的MySql服务器导入到HBaseHadoop版本:2.7.3HBase版本:1.2.4Sqoop版本:1.4.6(Hadoop2.0.4-alpha)Hadoop和HBase工作正常没有问题,但是运行命令./sqoopimport--connectjdbc:mysql://localhost:3306/company--tablepeople--usernamemysqluser-P--hbase-tablepeople_import--c

mysql - 无法使用sqoop从配置单元分区表mysql表中导出数据

我正在研究POC,我们需要将数据从MySQLDb获取到Hive分区表,然后需要将数据传输到MySQLDB表。我创建了支持酸属性并按年和月分区的表。所以目前我无法将数据传输到MySQLDB。那么有人可以建议我如何实现这一目标吗? 最佳答案 您可以使用Sqoopimport将表数据传输到hive,方法如下:sqoopimport--connect--username-P--table--target-dir--fields-terminated-by","--hive-import--create-hive-table--hive-ta

java - sqoop导入java io异常: Mkdir failed to create a file

通过sqoopjava将MySQL数据导入HDFS时出现错误。但是我授予了hdfs的所有权限,然后我也遇到了同样的问题。任何人都可以解决这个问题。Hadoop版本:2.6.0Sqoop:1.4.6请准确地建议我应该给本地文件系统什么权限。提前致谢。16/12/2813:14:54WARNsqoop.ConnFactory:$SQOOP_CONF_DIRhasnotbeensetintheenvironment.Cannotcheckforadditionalconfiguration.16/12/2813:14:54INFOmanager.SqlManager:Usingdefault

hadoop - Sqoop 直接导入 Netezza 表权限

作为POC的一部分,我们使用netezzadirect将数据从Netezza导入到Hadoop。有几个关于Netezza特定和NetezzaSqoop集成的问题。Q1。Sqoop直接模式是否总是需要CREATEEXTERNALTABLE和DROP权限才能执行直接传输?Q2。外部表是否在Netezza中创建?如果是,哪个数据库?我看到Sqoop使用以下查询:CREATEEXTERNALTABLE'/yarn/local/usercache/someuser/appcache/application_1483624176418_42787/work/task_1483624176418_4

hadoop - 带分区的 sqoop 配置单元导入

我有一些sqoop作业导入到我想要分区的配置单元中,但我无法让它运行。导入实际上会起作用:表是sqooped,它在配置单元中可见,有数据,但是当我描述表时,我期望看到的分区参数没有出现。我已经将此表作为csvsqooped,创建了一个外部Parquet表,并将数据插入其中(有效),但我希望能够尽可能避免额外的步骤。这是我当前的代码。我是否遗漏了什么,或者我正在尝试做不可能的事情?谢谢!sqoopimport-Doraoop.import.hint=""\--options-file/home/[user]/pass.txt\--verbose\--connectjdbc:oracle:

hadoop - SQOOP 1 无法加载 Sybase 驱动程序 - 无法加载数据库驱动程序类 : com. sybase.jdbc3.jdbc.SybDriver

我正在尝试使用sqoop-1从sybaseIQ导入数据。jdts-1.3.1.jar放在/sqoop/sqoop-1.4.6/lib文件夹中。当这个语法运行时,sqoopimport--connect'`jdbc:jtds:sybase:tds`://10.***.*.***@5500:*****'--driver'com.sybase.jdbc3.jdbc.SybDriver'--username"username"--password-p--query"select*fromdw.DM_ADDRESSwhererownum我在这里错过了什么?我使用的是正确的驱动程序吗?这是http

hadoop - sqoop增量导入命令出错

我正在处理sqoop增量导入命令。但我最后收到错误消息,我无法理解问题出在哪里。下面是我的MySQL表数据+----+-----------+|ID|NAME|+----+-----------+|1|Sidhartha||2|Sunny||3|Saketh||4|Bobby||5|Yash||6|Nimmi|+----+-----------+有4条记录的Hive表:DAY是分区列importedtable.idimportedtable.nameimportedtable.day1Sidhartha12Sunny13Saketh14Bobby1我的Sqoop命令:sqoopimpo

mysql - sqoop 作业将数据导出到 mysql,卡在 map 100% with status running

所以我尝试使用sqoop将数据从impala导出到mysql,这是由oozie作业安排的。但是当第一个sqoop操作开始时,它停留在map100%和reduce0%,并且所有其他操作都被填充。奇怪的是,在我kill这个oozie作业之前,mysql中没有数据,但是在我kill之后,mysql表中出现了数据(只有与第一个卡住的sqoopAction相关的表)。这是我的导出脚本:enterimagedescriptionhere我的oozie工作操作如下所示:thefirstrunningistheonestuck并且没有错误日志存在。 最佳答案