Sqoop_草庐IT

java - 从 sql server 导入数据的 Sqoop 作业忽略模式

如何将模式名称传递给sqoop作业，将数据从SQLServer导入到hdfs？sqoopjob--createjob_name--import--connect"jdbc:sqlserver://server:port;database=datatabase_name;username=user;password=password"--tablesource_table--as-avrodatafile--target-dirdata/target_folder----schemaschema_name当我使用执行作业时sqoopjob-execjob_name生成的查询缺少架构名称。

mysql - Sqoop - 如果使用 order by 和 limit 1，则导入最大值查询失败

我有一个简单的Sqoop查询，我用它来导入表ID的最大值并将其存储在HDFS中。存储在HDFS中是客户要求的，所以出于多种原因我要这样做。为了得到我用过的最大值sqoopimport\--connectjdbc:mysql://abc.com/sqoopemp\--usernameroot\--passwordroot\--e'selectmax(id)fromempWHERE$CONDITIONS'\--target-dirsqooplastmax\--m1\--drivercom.mysql.jdbc.Driver上面的查询给了我所需的答案，但出于性能原因，我正在考虑使用以下内容s

hadoop - strace'ing sqoop 命令时资源暂时不可用 futex

我有一个sqoop命令，它使用hcatalog参数将数据从Oracle导入到hiveorc表中。sqoopimport-Doraoop.disabled=true-Dmapred.child.java.opts="\-Djava.security.egd=file:/dev/../dev/urandom"--connect'jdbc:oracle:thin:@(DESCRIPTION=(ADDRESS=(PROTOCOL=TCP)(HOST=dbs-dev-v.com)(PORT=1533))(CONNECT_DATA=(SERVICE_NAME=SDADCOM)(Server=Ded

hadoop - Apache Sqoop 是否支持从 HIVE 到 Cassandra 的数据传输。

这些(Hive/Cassandra)都不是关系型的。Hive受JDBC支持，我认为与Hive兼容。最佳答案您说得对Sqoop与JDBC一起工作。例如，使用ProgressJDBCdriver，您可以从Sqoop按如下方式从HDFS导出到Cassandra:sqoopexport--connect'jdbc:datadirect:cassandra://MyServer:9042;KeyspaceName=MyKS'--drivercom.ddtek.jdbc.cassandra.CassandraDriver--table'bl

oracle - SQOOP输出文件大小不均匀

我有一个庞大的新闻数据库，但每当我尝试对其进行sqoop时，它都会写入2-3个文件，而不是整个200个文件。sqoopimport-Dmapred.map.max.attempts=4\-Ddfs.blocksize=1073741824\-Doraoop.block.allocation=RANDOM\-Dmapred.job.queue.name=default\-m200\--split-byAUTHOR_ID\--connectjdbc:oracle:thin:@$127.0.0.1:1521:SRDB\--usernameabc\--password1234\--tableL

mysql - sqoop导出mysql分区

我正在尝试使用sqoop从分区的配置单元表导出到mysql。起初我尝试做$sqoopexport--connectjdbc:mysql:///--username-P--tablesource_edge_daily--export-dir/path/to/table/--input-fields-terminated-by'\t'--verbose命令错误说Openfailedforfile/path/to/table//,attempttoopenadirectory当我指向分区目录时$sqoopexport--connectjdbc:mysql:///--username-P--t

hadoop - Sqoop Teradata 连接器问题 - 错误 : The user does not have CREATE TABLE access to database

当我尝试从TeradataView导入表时，我遇到了Sqoop的Teradata连接器问题。我只能访问View。但不知何故，当sqoop作业开始时，它试图在我正在访问的TeradataDB中创建一个表，但无权在该DB/schema中创建任何表我低于错误13/05/3103:40:12ERRORtool.ImportTool:EncounteredIOExceptionrunningimportjob:com.teradata.hadoop.exception.TeradataHadoopSQLException:com.teradata.jdbc.jdbc_4.util.JDBCExc

java - 使用 Apache Sqoop 从 MySQL 导入数据 - 错误 : No manager for connect string

我正在尝试将Mahout与外部数据源集成。我正在关注ApacheMahoutCookbook为此预订。我已经配置了Hadoop2.4、MySQL服务器并且我已经将一个虚拟数据库导入到mysql中。我还按照书中的步骤安装了ApacheSqoop，并在Sqoop库(sqoop/lib)中下载并部署了mysql-connector-java-5.1.30.jar我用ant命令构建了sqoop:antmvn-install构建顺利。我正在尝试使用书中所述的以下命令从mysql导入数据:sqoopimport-all-tables--connectjdbc:mysql/localohost/bb

hadoop - 如何使用 Hadoop、Hive 和 Sqoop 从 MS SQL Server 检索和分析数据？

我想对数据库(MSSQLServer)中的数据进行分析。那么如何在Sqoop/Hive的帮助下将数据带到HDFS上呢？Hive/Sqoop有可能吗？请建议我该怎么做。谢谢。最佳答案 Microsoft最近发布了SQLconnectorforsqoop.很少有ETL工具(开源和非开源)也可以从SQL连接到Hadoop(如Talend等) 关于hadoop-如何使用Hadoop、Hive和Sqoop从MSSQLServer检索和分析数据？，我们在StackOverflow上找到一个类似的问

hadoop - 将 Sqoop 数据从 HDFS 迁移到 Hive

当使用Sqoop将一堆大型MySQL表导入HDFS时，我忘记包含--hive-import标志。所以现在我已经将这些表放在HDFS中，并且想知道是否有一种简单的方法可以将数据加载到Hive中(无需自己编写LOADDATA语句)。我尝试使用sqoopcreate-hive-table:./bin/sqoopcreate-hive-table--connectjdbc:mysql://xxx:3306/dw--usernamexxx--passwordxxx--hive-import--tabletweets虽然这确实创建了正确的配置单元表，但它没有向其中导入任何数据。我觉得我在这里遗漏了