Sqoop

hadoop - 尝试使用 Sqoop 将数据从 Cassandra 传输到 Hadoop 时出错

我使用tarball安装了Cassandra-2.2.7。Cassandra运行良好，我在键空间中创建了表。现在我想将这个表数据传输到HDFS中。我正在使用Sqoop-1.4.6。我将以下库文件保存在$SQOOP_HOME/lib/下，apache-cassandra-2.2.7.jarapache-cassandra-thrift-2.2.7.jarcassandra-jdbc-1.2.5.jarcassandra-all-1.2.0.jarlibthrift-0.8.0.jarthrift-server-0.3.7.jar然后我运行命令，bin/sqooplist-tables--

时出 Cassandra apache java org hadoop thrift sqoop

hadoop - [Vertica][VJDBC](100172) 一行或多行被服务器拒绝

使用Sqoop将数据从Impala加载到Vertica时出现以下错误。Error:java.io.IOException:Can'texportdata,pleasecheckfailedmaptasklogsatorg.apache.sqoop.mapreduce.TextExportMapper.map(TextExportMapper.java:112)atorg.apache.sqoop.mapreduce.TextExportMapper.map(TextExportMapper.java:39)atorg.apache.hadoop.mapreduce.Mapper.run

多行 Vertica java apache mapreduce hadoop sqoop impala

hadoop - OOZIE:全局作业 xml 中引用的文件中定义的属性在 workflow.xml 中不可见

我是hadoop的新手，现在我正在测试仅使用单个sqoop操作的简单工作流。如果我使用纯值而不是全局属性，它会起作用。然而，我的目标是在job-xml中引用的文件中定义一些全局属性。全局部分中的标记。经过长时间的斗争和阅读很多文章，我仍然无法让它工作。我怀疑一些简单的事情出了问题，因为我发现有文章表明此功能可以正常工作。希望你能给我一个提示。简而言之:我有属性，dbserver,dbuser和dbpassword在/user/dm/conf/environment.xml中定义我的/user/dm/jobs/sqoop-test/workflow.xml中引用了这些属性在运行时，我收到

xml workflow code gt lt hadoop sqoop oozie

hadoop - oozie Sqoop 操作无法将数据导入配置单元

我在执行ooziesqoop操作时遇到问题。在日志中，我可以看到sqoop能够将数据导入临时目录，然后sqoop创建配置单元脚本来导入数据。将临时数据导入配置单元时失败。在日志中我没有收到任何异常。下面是我正在使用的sqoopAction。hcat.metastore.uri${HIVE_THRIFT_URL}hcat.metastore.principal${KERBEROS_PRINCIPAL}${jobTracker}${nameNode}/tmp/hive-oozie-site.xmloozie.hive.defaults/tmp/hive-oozie-site.xmljob-

配置单 hadoop lt gt code hive bigdata sqoop oozie

sql-server - 如何使用 Sqoop 将数据从关系数据库导入沙箱 Hive？

如何使用Sqoop将数据从关系数据库导入沙盒中的Hive。我在我的电脑上安装了HortonWorks沙箱。Nw我想知道这个迁移。我已经引用了这个链接http://hortonworks.com/kb/using-apache-sqoop-for-data-import-from-relational-dbs/但我有些疑惑1、运行需要Sqoop软件吗？2，在上面提到的链接中有一些代码，我将把这段代码放在哪里？在Hive查询窗口中？3、是否可以完全迁移数据库(或仅按时间表迁移)？4、存储过程和Viwes我将把所有这些都保存在哪里？最佳答案

沙箱 sql-server table tableName code hadoop hive sandbox sqoop

hadoop - Sqoop Import to Hive 在某个点无限期挂起

我正在尝试使用SqoopImport将mysql表导入Hive，但是在执行命令后，CLI保持平静，没有任何反应，并且无限期挂起。下面是命令和问题的详细信息..[cloudera@quickstartbin]$sqoopcreate-hive-table--connectjdbc:mysql://10.X.X.XX:XXXX/rkdb--usernameroot-P--tableemployee--hive-tableempsWarning:/usr/lib/sqoop/../accumulodoesnotexist!Accumuloimportswillfail.Pleaseset$A

无限期 hadoop DEBUG mapreduce sqoop hive sqoop2

hadoop - 通过oozie运行shell脚本

我正在尝试通过oozie执行shell脚本，但我遇到了一些问题。我有一个这样的属性文件(import.properties):startIndex=2000chunkSize=2000想法是，在每次执行中，startIndex值都会根据block大小进行更新。所以如果我执行它，它应该有startIndex=4000chunkSize=2000我已经单独测试了脚本，它运行良好。这是我的其他相关文件。工作属性nameNode=hdfs://192.168.56.101:8020jobTracker=192.168.56.101:50300wfeRoot=wfequeueName=defau

hadoop oozie ambari_qa ambari code cloud cloudera sqoop

hadoop - 无主键无时间戳使用sqoop增量加载数据

我有一个没有任何主键和修改日期/时间戳的表。这个表就像一个不断保存所有数据的事务表(没有删除/更新)。我现在的问题是我想将数据注入(inject)HDFS，而无需在每次运行增量加载时再次加载整个表。如果我的表有主键，下面的代码获取导入到HDFS的最新行。sqoopjob\--createtb_w_PK_DT_append\--\import\--connectjdbc:mysql://10.217.55.176:3306/SQOOP_Test\--usernameroot\--incrementalappend\--check-columnP_id\--last-value0\--ta

hadoop sqoop TransactionHistoryTable TriggerHistoryTable 39 hdfs

hadoop - sqoop 作业未使用参数运行

我正在尝试运行sqoop作业。我正在使用sqoop版本Sqoop1.4.6-cdh5.8.0但它不适用于此版本它在Sqoop1.4.5-cdh5.4.0上运行良好。sqoopjob--createE8--import--connectjdbc:mysql://localhost/test--usernameroot--passwordcloudera--tableNAME--hive-import-m1sqoopjob--execE8----tabledummy1是否有任何语法问题。如果有人可以帮助解决这个问题。Warning:/usr/lib/sqoop/../accumulodoe

hadoop sqoop section strong

【头歌】Sqoop数据导出 - 详解

【提示】点击每一关参考答案可以快速复制。目录第1关：Sqoop数据导出语法学习任务描述相关知识编程要求测试说明参考答案第2关：HDFS数据导出至Mysql内任务描述相关知识编程要求测试说明参考答案第3关：Hive数据导出至MySQL中任务描述相关知识编程要求测试说明参考答案第1关：Sqoop数据导出语法学习任务描述本关任务：学习Sqoop导出(export)的基本语法并配置好环境。相关知识为了完成本关任务，你需要掌握：1、Sqoop导出(export)的基本参数。2、配置环境。Sqoop导出(export)的基本参数。Sqoop能够让Hadoop上的HDFS和Hive跟关系型数据库之间进行数据

导出详解 code xff 数据 mysql 数据库 linux sqoop hive

14 15 161718 19 20