Sqoop-Export_草庐IT

hadoop - 在 Sqoop2 客户端 API 中提交作业时出现问题

我在双节点集群上使用Hadoop-2.2.0，hadoop配置正确且工作正常，现在我尝试在其上安装sqoop2(sqoop-1.99.3-bin-hadoop200)并尝试访问sqoop2网络用户界面(如localhost:12000)得到以下内容。ApacheSqoop根目录当尝试访问cloudera.com:12000/sqoop/version时，我得到了关注HTTP状态404-当我在sqoop客户端中使用它时[stratapps@cloudera2~]$sqoop.shclientSqoophomedirectory:/usr/local/sqoop2SqoopShell:Ty

时出 hadoop sqoop local

postgresql - 在 Docker 中使用 Sqoop 导入 PostgreSQL

我的本地机器(Windows)上有一个PostgreSQL数据库，我想使用ApacheSqoop将它导入到我的Hortonworks沙箱中。虽然像this听起来不错，复杂的因素是我的Sandbox位于Docker容器中，所以像sqooplist-tables--connectjdbc:postgresql://127.0.0.1/ambari--usernameambari-P这样的语句似乎遇到身份验证错误。我认为问题出在尝试从docker容器内部连接到本地主机。我看了thispost关于从容器内连接到MySQL数据库和thisone尝试改用PostgreSQL，但到目前为止还没有

postgresql code section postgres hadoop docker sqoop hortonworks-sandbox

hadoop - 在 sqoop 导入或导出期间处理错误记录

我查看了sqoopexportoperation提供的选项，但找不到任何处理坏记录的选项。例如，有时在大量记录中需要数字的地方可能会出现一个字符。有没有一种方法可以在sqoop中处理这些情况而不会导致作业失败并在文件中提供错误记录。最佳答案 Sqoop目前期望导出的数据是干净的，并且不提供处理损坏数据的工具。在使用Sqoop导出数据之前，您可以使用MR/Pig/Hive作业清理数据。关于hadoop-在sqoop导入或导出期间处理错误记录，我们在StackOverflow上找到一个类

hadoop sqoop section stackoverflow

hadoop - 如何在 Windows 系统中安装 Sqoop 以及它需要哪些必要的东西？

我尝试安装sqoop，因为我指的是一些安装指南，其中说HBase和mapr作为先决条件安装。我不明白如何进行。那么有人可以指导我如何在Windows系统中安装Sqoop以及它需要哪些必要的东西吗？最佳答案如果您想在Windows上使用Sqoop/Hadoop进行播放/调试-您可以在您的机器上安装HDInsight模拟器。这将安装包括sqoop和sqoop连接器的单节点Hadoop部署。我写的以下帖子可以指导您完成整个过程。它展示了如何在您的开发箱上安装Hadoop和SQLExpress，以及如何通过Sqoop导入/导出数据。ht

中安何在 section sqoop hadoop hbase mapr

hadoop - Sqoop Export Oozie Workflow 因未找到文件而失败，从控制台运行时有效

我有一个包含6个节点的hadoop集群。我正在通过Sqoop从MSSQL中提取数据并返回到MSSQL中。Sqoop导入命令运行良好，我可以从控制台(在其中一个hadoop节点上)运行sqoop导出命令。这是我运行的shell脚本:SQLHOST=sqlservermaster.localSQLDBNAME=db1HIVEDBNAME=db1BATCHID=USERNAME="sqlusername"PASSWORD="password"sqoopexport--connect'jdbc:sqlserver://'$SQLHOST';username='$USERNAME';passwo

Workflow hadoop apache java hive oozie sqoop hue

hadoop - sqoop:如何从 mySql 获取增量更新

我正在尝试让Sqoop读取mysql表的内容。到目前为止，我已经成功地转储了HDFS表的完整内容，而且我还成功地获得了基于id的增量更新。我无法做的是根据日期或日期时间戳获取增量更新。作业似乎运行正确(没有错误)，但没有任何内容写入HDFS我正在运行的命令是:sqoopimport--connectjdbc:mysql://localhost/myDb--usernameme--passwordmyPassword--warehouse-dir/inc-3--tablemyTable--incrementallastmodified--check-columndatestamp--la

hadoop sqoop section strong last-value

apache - 支持 Hive、Sqoop 和 Pig

ApacheAtlas是否支持Spark、Pig和Sqoop的标签？如果Atlas支持Pig、Sqoop和Spark，那么是否有任何类型的定制我们必须执行才能使其在Atlas中运行。如果我们想实现上述内容，我们可以从那里获得确切的过程带有Atlas的Hadoop组件。Atlas在哪里存储元数据？我们如何获得Atlas元数据的架构。Atlas是否提供为其他工具(例如Informatica)并将其与自己的元数据集成？如果Atlas支持上述功能，那么我们如何集成informatica使用Atlas元数据。最佳答案问题1:可以在http

apache Sqoop Atlas section hadoop hortonworks-data-platform

oracle - Sqoop 作业因 Oracle 导入的 KiteSDK 验证错误而失败

我正在尝试运行Sqoop作业以从Oracle数据库加载并以Parquet格式加载到Hadoop集群。这项工作是增量的。Sqoop版本为1.4.6。甲骨文版本是12c。Hadoop版本为2.6.0(发行版为Cloudera5.5.1)。Sqoop命令是(创建作业并执行它):$sqoopjob-fshdfs://:8020\--createmyJob\--import\--connectjdbc:oracle:thin:@:/\--username\-P\--as-parquetfile\--table.\--target-dir\--incrementalappend\--check-c

KiteSDK oracle java sqoop apache hadoop cloudera

hadoop - Couchbase/hadoop 连接器 : sqoop job FAILED "Found interface org.apache.hadoop.mapreduce.TaskAttemptContext, but class was expected"

我的配置:CouchBase服务器2.0Sqoop1.4.2(为hadoop版本2.0.0编译)栈HadoopCDH4.1.2我想使用CouchBase/Hadoop连接器(http://www.couchbase.com/develop/connectors/hadoop)，但是当我启动导入时出现以下错误:sqoop-import--connecthttp://localhost:8091/pools--tableDUMP13/01/0711:00:34INFOtool.CodeGenTool:Beginningcodegeneration13/01/0711:00:34INFOor

hadoop TaskAttemptContext JobClient mapred INFO couchbase sqoop

hadoop - Sqoop 导入问题 - java.lang.IncompatibleClassChangeError : Found class org. apache.hadoop.mapreduce.JobContext，但接口(interface)是预期的

我正在使用Sqoop1.4.3与hadoop1.2.4和hive0.11.0当我尝试执行sqoop导入时:它抛出了IncompatibleClassChangeError。任何解决这个问题的建议..使用的Sqoop命令:sqoopimport--connectjdbc:mysql://localhost:3306/employees\--usernametest--passwordtest跟踪:Exceptioninthread"main"java.lang.IncompatibleClassChangeError:Foundclassorg.apache.hadoop.mapredu

hadoop IncompatibleClassChangeError apache java org sqoop