Sqoop

hadoop - Sqoop 错误外来输入 't1' 期望 EOF 接近 '<EOF>'

我正在尝试将一些数据从Hive集群导入到另一个具有多个映射器的HDFS集群。我正在使用以下命令导入数据。/opt/isv/app/pkgs/sqoop-1.4.4.bin__hadoop-1.0.0/bin/sqoopimport--connectjdbc:hive://XXXXXX.com:10000/strrecommender--driverorg.apache.hadoop.hive.jdbc.HiveDriver-e'从strrecommender.sltrn_dtl_full中选择upc_cd、sltrn_dt、sltrn_id、loc_id、pos_rgstr_id、hh

amp 39 apache java sqoop hadoop

hadoop - 使用 sqoop 的 Oozie 工作流

我在我的系统中安装了oozie4.0.0和Hadoop1.2.1我的目标是在oozie中编写sqoop作业。正如我在谷歌上搜索并获得以下链接:-http://rvs.github.io/oozie/installing.htmlhttp://srikanthayalasomayajulu.blogspot.sg/2013/02/apache-oozie-331-installation-on-apache.htmlwww.tanzirmusabbir.com/2013/05/chunk-data-import-incremental-import-in.html所有链接都非常好。我面临

hadoop Oozie section apache strong jobs sqoop oozie-coordinator

sql-server-2008 - 如何 - 使用 View 将 sqoop 导出到 sql server

server sql-server code section strong sql-server-2008 hadoop hive sqoop

hadoop - 如何使用sqoop从hadoop加载数据到solr？

我想将通过现在驻留在HDFS中的MR作业创建的索引复制到solr中。是否可以使用sqoop？如果是，要使用的jdbc连接器或驱动程序是什么？如果不是sqoop，还有其他方法吗？最佳答案您可能需要考虑使用水槽。https://flume.apache.org/FlumeUserGuide.html#flume-1-5-2-user-guideMorphlineSolrSink:此接收器非常适合将原始数据流式传输到HDFS(通过HdfsSink)并同时提取、转换并将相同数据加载到Solr中的用例(通过MorphlineSolrSin

hadoop sqoop section FlumeUserGuide flume jdbc solr hdfs

postgresql - 大量导出时出现 Sqoop PSQLException "Sorry, too many clients already"

当从HDFS导出大型(超过200万行)表到Postgres时，我看到Sqoop抛出PSQLException“抱歉，客户端已经太多了”。我有几张较小的table(约300万张)，它们似乎运行良好。即使大表出现故障，我的postgres表中似乎仍然有大约200万行，但我猜这只是来自那些没有死的worker，因为他们首先获得了其中一个连接。我的Postgres表配置为允许300个max_connections，并且有大约70个连接始终来自其他应用程序，因此SQOOP应该有大约230个可供使用。我尝试在我的SQOOP导出命令中将--num-mappers切换为2-8，但这似乎并没有太大的区别

时出 PSQLException section code 跟踪器 postgresql hadoop hdfs sqoop

sql-server - 从配置单元到 sql 的 Sqoop 导出被卡住了

我正在使用WindowsAzureHDInsightsHadoop集群，我正在尝试将配置单元表从那里导出到SQLAzure服务器。hive表非常简单(实际上，目前它由一列数据组成，没有任何空格字符和其他特殊符号)。在服务器端，它也是一个具有以下架构的表:CREATETABLEexp(line[nvarchar](100))对于导出，我使用以下PS脚本:$tableName='exp'$connectionString="jdbc:sqlserver://$sqlDatabaseServerName.database.windows.net;user=$sqlDatabaseLogin@

配置单元到 section code sql-server azure hadoop azure-hdinsight

hadoop - Sqoop增量导入 "Cannot append files to target dir"

我在使用Sqoop将数据从MySQL导入Hive时遇到问题...这个查询:sqoopimport--connectjdbc:mysql://xx.xx.xx.xx/database\--usernamesqoop--passwordsqoop--tabledatatable\--target-dir/home/cloudera/user/hive/warehouse/database.db/datatable\--as-parquetfile-m1--append返回这个错误:15/01/1416:27:28WARNutil.AppendUtils:Cannotappendfilest

amp hadoop section sqoop strong hive impala

mysql - Sqoop 导入安全 hbase 失败

我正在使用具有kerberos安全性的hadoop-2.6.0。我已经安装了具有kerberos安全性的hbase，并且能够创建表并对其进行扫描。我也可以运行sqoop作业将数据从mysql导入到hdfs，但是当尝试从mysql导入到HBase时sqoop作业失败。Sqoop命令sqoopimport--hbase-create-table--hbase-tablenewtable--column-familyck--hbase-row-keyid--connectjdbc:mysql://localhost/sample--usernameroot--passwordroot--ta

mysql Sqoop section strong hbase hadoop kerberos

hadoop - 我怎么知道Sqoop在Hadoop和NoSQL之间传输数据的时间？

我是Hadoop的新手。我需要从couchbase导入数据到hdfs。已经完成了。但是，我怎么知道数据传输已经完成，这样我就可以用这些数据顺序运行作业（mapreduce）？非常感谢你。最佳答案在完成第一个sqoop加载作业后自动触发第二个作业的最佳方法是使用Oozieworkflow自动化。他们创造了两个动作，第一个动作是一个具有相关属性的sqoop动作配置为将数据从couchbase表加载到hdfs。让第二个作业是任何（HIV/MapReduce／Shell／Java）动作将访问第一个操作的输出，然后开始处理。第二个操作将在

hadoop section br stackoverflow cron couchbase sqoop

apache - sqoop 导入错误 - 文件不存在 :

我正在尝试使用Sqoop将数据从MySql导入到HDFS。但是我收到以下错误。如何解决？命令:sqoopimport--connectjdbc:mysql://localhost/testDB--usernameroot--passwordpassword--tablestudent--m1错误:ERRORtool.ImportTool:EncounteredIOExceptionrunningimportjob:java.io.FileNotFoundException:Filedoesnotexist:hdfs://localhost:54310/usr/lib/sqoop/lib

apache sqoop java hadoop bigdata

31 32 333435 36 37