草庐IT

hadoop - sqoop 错误 [主] tool.ImportTool

您好,当我尝试将MySql表导入hdfs时出现错误:sqoopimport--connectjdbc:mysql://dba-virtual-machine/test--usernamesocio--tabletextlines--columnsline--target-dir/textlines2014-06-1607:43:24,308INFO[main]manager.MySQLManager:PreparingtouseaMySQLstreamingresultset.2014-06-1607:43:24,319INFO[main]tool.CodeGenTool:Beginn

hadoop - 使用 Sqoop 从 Oracle 直接导入到 Hadoop

我想在从Oracle导入数据时使用--direct参数。是否可以使用--direct选项来使用数据转储/泵实用程序?我是否需要在我的shell上安装任何Oracle实用程序?如果是,请建议我需要安装什么?达美什 最佳答案 遗憾的是,没有使用DataPump实用程序的Sqoop连接器。Oracle确实有自己的(闭源)大数据连接器。我相信Hadoop的SQLLoader使用数据泵格式。 关于hadoop-使用Sqoop从Oracle直接导入到Hadoop,我们在StackOverflow上找

hadoop - sqoop 导入大量 NULL 行

我正在将一个表从mysql导入到hive。该表有2115584行。在导入过程中我看到了13/03/2018:34:31INFOmapreduce.ImportJobBase:Retrieved2115584records.但是当我对导入的表执行count(*)时,我看到它有49262250行。这是怎么回事?更新:指定--direct时导入工作正常。 最佳答案 想通了。来自sqoop用户手册:HivewillhaveproblemsusingSqoop-importeddataifyourdatabase’srowscontainst

hadoop - sqoop 导入/导出是否创建 java 类?如果这样做,这些类的位置是什么?

sqoopimport/export是否创建java类?如果这样做,我在哪里可以看到这些生成的类。这些类文件的位置是什么? 最佳答案 sqoopimport/export是否创建java类?Yes如果这样做,我在哪里可以看到这些生成的类。这些类文件的位置是什么?Itautomaticallygeneratesajavafileofsametablenameinthecurrentpathoflocalsystem.您可以使用--outdir来提供您自己的路径。根据评论更新您可以为此使用codegen命令:sqoopcodegen\-

Hadoop - sqoop 导出/导入分区表

谁能解释一下如何将分区表从hive导出到MYSQL数据库?如何从mysql导入到hive分区表?我已经阅读了google中的文档,但不确定可以使用的最新技术。谢谢 最佳答案 sqoop到hive分区导入1。在mysql中创建一个包含4个字段(id、姓名、年龄、性别)的表CREATETABLE`mon2`(`id`int,`name`varchar(43),`age`int,`sex`varchar(334))2。使用csvabc.csv将数据插入mysql表1,mahesh,23,m2,ramesh,32,m3,prerna,43,

hadoop - 如何使用sqoop将json数据从hdfs插入到mysql?

我已经将JSON数据加载到我的HDFS,我在MySQL数据库中创建了包含所需列的表,如下所示。如何使用行格式器创建表格以接受JSON?我的HDFS数据{"Employees":[{"userId":"rirani","jobTitleName":"Developer","firstName":"Romin","lastName":"Irani","preferredFullName":"RominIrani","employeeCode":"E1","region":"CA","phoneNumber":"408-1234567","emailAddress":"romin.k.ira

database - 使用 Sqoop 从 Sybase 导入数据的问题

我正在尝试使用Sqoop从Sybase导入数据。从日志中我可以说我已经成功地进行了连接。但是我的工作失败了,给了我一些来自Sybase的Sql异常。我主要不是在Sybase上工作,所以无法从这个错误中挖掘出太多信息。我的资源中只有一个位于Sybase。我使用了以下命令:sqoopimport--verbose\--drivercom.sybase.jdbc3.jdbc.SybDriver\--connectjdbc:sybase:Tds:nyhostx123.sm.com:13290/DATABASE=tempdb\--tabletempdb..mit\--split-bysipid\

hadoop - Oozie 和 sqoop 配置问题

我正在尝试设置oozie和sqoop工作流(我想将mySql数据备份到我的hdfs中)。但是当我尝试开始我的工作时,我遇到了困难。我正在使用hadoop2(工作中的hdfs节点),oozie的最新版本。我在我的电脑上安装了oozie服务器(我想在部署它之前测试它),在oozieconf/haddop-conf目录)和我在服务器上的hdfs。我做了一个基本的工作流程(测试目的,我只是想看看sqoop是否工作)是这样的:yarn.resourcemanager.address:8040hdfs://hdfs-server:54310job--listActionfailed,errorme

mysql - sqoop从hdfs导出到mysql是否保留分区

我已经创建了一个多节点hadoop集群并在其上安装了hive。另外,我在另一台远程机器上安装了MySQL。我打算将存储在HDFS中的数据导出到关系型数据库MySQL中。我研究了如何使用Sqoop完成此操作。所以我发现我需要在MySQL中创建一个表,该表具有相同顺序的目标列(与Hive中存在的一样),并具有适当的SQL类型。然后使用sqoopexport命令。我的问题是:如果表在Hive中分区,并且在MySQL中创建表时我相应地对其进行分区,sqoopexport命令会保留分区吗?我的问题类似于sqoopexportmysqlpartition.我想知道分区支持是否已添加到sqoop。这

mysql - 使用 sqoop 将 float 和 double 从 hdsf 导出到 MySql 时出现问题

我正在使用hadoop版本1.2.1和sqoop1.4.4我是hadoop/sqoop的新手,遇到了问题。我在hdfs中有数据要导出到MySQL,但导出一直失败。我使用的语句是:sqoopexport--connectjdbc:mysql://{ipaddress}/{database}--usernameusername-P--table{tablename}--export-dir{export-dir}--input-fields-terminated-by','--lines-terminated-by'\n'--verbose我得到的错误是:14/02/2810:12:40I