草庐IT

mysql - Sqoop 将数据从 MySQL 表复制到分区的 Hive 表

我写了一个Sqoop脚本:HADOOP_USER_NAME=hdfssqoopimport--connectjdbc:mysql://cmsmaster.cy9mnipcdof2.us-east-1.rds.amazonaws.com/db--usernameuser-password-file/user/password/dbpass.txt--fields-terminated-by','--target-dir/user/db/sqoop_internal--delete-target-dir--hive-import--hive-overwrite--hive-tablesqo

scala - 无法从Sqoop创建的Spark中的序列文件创建数据框

我想读取orders数据并从中创建RDD,它作为sequence文件存储在cloudera的hadoopfs中虚拟机。以下是我的步骤:1)将订单数据导入为序列文件:sqoopimport--connectjdbc:mysql://localhost/retail_db--usernameretail_dba--passwordcloudera--tableorders-m1--target-dir/ordersDataSet--as-sequencefile2)在sparkscala中读取文件:星火1.6valsequenceData=sc.sequenceFile("/ordersD

hadoop - HDP Sandbox SQOOP 由于权限错误而失败

错误信息如下:Unabletomovesourcehdfs://sandbox-hdp.hortonworks.com:8020/user/maria_dev/DimDepartmentGroup/part-m-00000todestinationhdfs://sandbox-hdp.hortonworks.com:8020/warehouse/tablespace/managed/hive/dbodimemployee/delta_0000001_0000001_0000:Permissiondenied:user=hive,access=WRITE,inode="/user/mar

hadoop - Sqoop中增量数据如何指定多列?

我正在使用以下查询在sqoop中获取增量数据-bin/sqoopjob--createJOB_NAME--import--connectjdbc:oracle:thin:/system@HOST:PORT:ORACLE_SERVICE--usernameUSERNAME--password-file/PASSWORD_FILE.txt--fields-terminated-by','--enclosed-by'"'--tableSCHEMA.TABLE_NAME--target-dir/TARGET_DIR-m2--incrementalappend--check-columnNVL(

hadoop - 使用 Sqoop 连接 Hive 和 Oracle 数据库

是否可以使用Sqoop将数据从hive导出到OracleDB以用于报告目的,因为我不想在客户端应用程序中进行任何更改。问候,巴格旺博比 最佳答案 使用insertoverwritedirectoryHive的选项用于将查询的输出写入文件,然后使用Sqoopexport将文件中的数据插入RDBM的选项。使用Oozie的工作流程或Azkaban(Azkaban是否支持Oozie和Hive任​​务?)也可用于自动化。 关于hadoop-使用Sqoop连接Hive和Oracle数据库,我们在St

mysql - Sqoop 导入 : Specify `select` expressions in a separate file?

将数据从MySQL导入Hive时,我需要规范化几个包含电话号码的文本字段。这需要相当复杂的逻辑,很难用单个SQLreplace函数在Sqoop命令行中表达。是否可以在单独的文件中指定SQLselect表达式并从命令行引用它?谢谢! 最佳答案 你可以试试:$sqoop--options-file/users/homer/work/option.txt-您的option.txt将如下所示:#OptionsfileforSqoopimport##Specifiesthetoolbeinginvokedimport#Connectparam

Sqoop 安装的 Hadoop 问题

我的本​​地机器上安装了Hadoop(伪分布式模式)、Hive、sqoop和mysql。但是当我尝试运行sqoop时,出现以下错误Error:/usr/lib/hadoopdoesnotexist!Pleaseset$HADOOP_COMMON_HOMEtotherootofyourHadoopinstallation.然后我使用所有信息设置sqoop-env-template.sh文件。下面是sqoop-env-template.sh文件的快照。即使在提供了hadoop配置单元路径之后,我仍然面临同样的错误。我已经安装了/home/hduser/hadoop版本1.0.3中的hado

mysql - 使用 Sqoop/Oozie 从 Hive 加载数据到 MySQL 表

在使用Sqoop(Oozie中的sqoop命令)将数据加载到MySQL表时,我遇到了一些严重的问题(尝试了196次不成功)。如果HDFS中只有一列数据(此处为foo),则没有问题,但是当有超过1列时,例如2列,数据未加载到MySQL。如果我单独运行Sqoop,那么数据会加载到MySQL,但是当我放入Oozie时,数据不会被加载。workflow.xml有两部分,第一部分将数据从Hive表加载到HDFS,第二部分将数据从HDFS加载到MySQL。我正在使用ClouderaVM。错误信息是:Causedby:java.lang.NumberFormatException:Forinputs

mysql - 使用 sqoop(1.4.5) 将 mysql 数据导入到 hdfs(hadoop 2.4.1)

我是Hadoop的初学者,试图使用sqoop1.4.5从我的本地数据库mysql导入一个表到hadoop2.4.1的hdfs。mysqlversion:5.5.38hdfsversion:hadoop2.4.1sqoopversion:1.4.5我尝试了sqoop-list-databases,它给出了正确的答案但随后给出以下命令:sqoopimport--connectjdbc:mysql://localhost:3306/information_schema--usernameroot--passwordroot--tableVIEWs-m1我得到:ERRORtool.Import

hadoop - 在 Hadoop 集群上使用 Oozie 运行 Sqoop Action 时出现问题

我正在尝试使用Hadoop集群在Oozie中成功运行sqoop-action。每当我检查作业状态时,Oozie都会返回以下状态更新:ActionID状态分机ID分机状态错误代码0000037-140930230740727-oozie-oozi-W@:start:OK-OK-0000037-140930230740727-oozie-oozi-W@sqoop-loadERRORjob_1412278758569_0002FAILED/KILLEDJA0180000037-140930230740727-oozie-oozi-W@sqoop-load-failOK-OKE0729这让我相