Sqoop-Export_草庐IT

hadoop - Apache Sqoop 是否支持从 HIVE 到 Cassandra 的数据传输。

这些(Hive/Cassandra)都不是关系型的。Hive受JDBC支持，我认为与Hive兼容。最佳答案您说得对Sqoop与JDBC一起工作。例如，使用ProgressJDBCdriver，您可以从Sqoop按如下方式从HDFS导出到Cassandra:sqoopexport--connect'jdbc:datadirect:cassandra://MyServer:9042;KeyspaceName=MyKS'--drivercom.ddtek.jdbc.cassandra.CassandraDriver--table'bl

oracle - SQOOP输出文件大小不均匀

我有一个庞大的新闻数据库，但每当我尝试对其进行sqoop时，它都会写入2-3个文件，而不是整个200个文件。sqoopimport-Dmapred.map.max.attempts=4\-Ddfs.blocksize=1073741824\-Doraoop.block.allocation=RANDOM\-Dmapred.job.queue.name=default\-m200\--split-byAUTHOR_ID\--connectjdbc:oracle:thin:@$127.0.0.1:1521:SRDB\--usernameabc\--password1234\--tableL

不均 oracle AUTHOR_ID AUTHOR code hadoop export sqoop

mysql - sqoop导出mysql分区

我正在尝试使用sqoop从分区的配置单元表导出到mysql。起初我尝试做$sqoopexport--connectjdbc:mysql:///--username-P--tablesource_edge_daily--export-dir/path/to/table/--input-fields-terminated-by'\t'--verbose命令错误说Openfailedforfile/path/to/table//,attempttoopenadirectory当我指向分区目录时$sqoopexport--connectjdbc:mysql:///--username-P--t

mysql sqoop java apache hadoop hive

hadoop - Sqoop Teradata 连接器问题 - 错误 : The user does not have CREATE TABLE access to database

当我尝试从TeradataView导入表时，我遇到了Sqoop的Teradata连接器问题。我只能访问View。但不知何故，当sqoop作业开始时，它试图在我正在访问的TeradataDB中创建一个表，但无权在该DB/schema中创建任何表我低于错误13/05/3103:40:12ERRORtool.ImportTool:EncounteredIOExceptionrunningimportjob:com.teradata.hadoop.exception.TeradataHadoopSQLException:com.teradata.jdbc.jdbc_4.util.JDBCExc

Teradata database java apache hadoop hdfs sqoop

java - 使用 Apache Sqoop 从 MySQL 导入数据 - 错误 : No manager for connect string

我正在尝试将Mahout与外部数据源集成。我正在关注ApacheMahoutCookbook为此预订。我已经配置了Hadoop2.4、MySQL服务器并且我已经将一个虚拟数据库导入到mysql中。我还按照书中的步骤安装了ApacheSqoop，并在Sqoop库(sqoop/lib)中下载并部署了mysql-connector-java-5.1.30.jar我用ant命令构建了sqoop:antmvn-install构建顺利。我正在尝试使用书中所述的以下命令从mysql导入数据:sqoopimport-all-tables--connectjdbc:mysql/localohost/bb

connect manager sqoop apache java mysql hadoop

hadoop - 如何使用 Hadoop、Hive 和 Sqoop 从 MS SQL Server 检索和分析数据？

我想对数据库(MSSQLServer)中的数据进行分析。那么如何在Sqoop/Hive的帮助下将数据带到HDFS上呢？Hive/Sqoop有可能吗？请建议我该怎么做。谢谢。最佳答案 Microsoft最近发布了SQLconnectorforsqoop.很少有ETL工具(开源和非开源)也可以从SQL连接到Hadoop(如Talend等) 关于hadoop-如何使用Hadoop、Hive和Sqoop从MSSQLServer检索和分析数据？，我们在StackOverflow上找到一个类似的问

hadoop section stackoverflow Sqoop hive

hadoop - 将 Sqoop 数据从 HDFS 迁移到 Hive

当使用Sqoop将一堆大型MySQL表导入HDFS时，我忘记包含--hive-import标志。所以现在我已经将这些表放在HDFS中，并且想知道是否有一种简单的方法可以将数据加载到Hive中(无需自己编写LOADDATA语句)。我尝试使用sqoopcreate-hive-table:./bin/sqoopcreate-hive-table--connectjdbc:mysql://xxx:3306/dw--usernamexxx--passwordxxx--hive-import--tabletweets虽然这确实创建了正确的配置单元表，但它没有向其中导入任何数据。我觉得我在这里遗漏了

hadoop Sqoop section hive table hdfs

hadoop - sqoop 错误 [主] tool.ImportTool

您好，当我尝试将MySql表导入hdfs时出现错误:sqoopimport--connectjdbc:mysql://dba-virtual-machine/test--usernamesocio--tabletextlines--columnsline--target-dir/textlines2014-06-1607:43:24,308INFO[main]manager.MySQLManager:PreparingtouseaMySQLstreamingresultset.2014-06-1607:43:24,319INFO[main]tool.CodeGenTool:Beginn

ImportTool hadoop apache java mapreduce ubuntu-12.04 hdfs sqoop

hadoop - 使用 Sqoop 从 Oracle 直接导入到 Hadoop

我想在从Oracle导入数据时使用--direct参数。是否可以使用--direct选项来使用数据转储/泵实用程序？我是否需要在我的shell上安装任何Oracle实用程序？如果是，请建议我需要安装什么？达美什最佳答案遗憾的是，没有使用DataPump实用程序的Sqoop连接器。Oracle确实有自己的(闭源)大数据连接器。我相信Hadoop的SQLLoader使用数据泵格式。关于hadoop-使用Sqoop从Oracle直接导入到Hadoop，我们在StackOverflow上找

hadoop Oracle section 实用 sqoop

hadoop - sqoop 导入大量 NULL 行

我正在将一个表从mysql导入到hive。该表有2115584行。在导入过程中我看到了13/03/2018:34:31INFOmapreduce.ImportJobBase:Retrieved2115584records.但是当我对导入的表执行count(*)时，我看到它有49262250行。这是怎么回事？更新:指定--direct时导入工作正常。最佳答案想通了。来自sqoop用户手册:HivewillhaveproblemsusingSqoop-importeddataifyourdatabase’srowscontainst

hadoop sqoop code section characters hive