Sqoop1_草庐IT

hadoop - 使用 Sqoop 导出到 Postgresql ltree

要将我的数据从HDFS导出到Postgres，我使用的是Sqoop(1.3.0-cdh3u4)。主要问题是我有一列ltree类型。ERRORorm.ClassWriter:CannotresolveSQLtype1111ERRORorm.ClassWriter:NoJavatypeforSQLtype1111forcolumnpath即使使用--map-column-java强制字符串解析，Sqoop也无法导出。java.io.IOException:org.postgresql.util.PSQLException:ERROR:column"path"isoftypeltreebut

hadoop - 使用 Sqoop 将数据附加到 hive 表

我正在尝试将数据附加到配置单元中现有的表。首先使用以下命令将表从MS-SQLServer导入配置单元。Sqoop命令:sqoopimport--connect"jdbc:sqlserver://XXX.XX.XX.XX;databaseName=mydatabase"--table"my_table"--where"Batch_Id>100"--usernamemyuser--passwordmypassword--hive-import现在我想将数据附加到配置单元中“Batch_Idsqoopimport--connect"jdbc:sqlserver://XXX.XX.XX.XX;

hadoop Sqoop table section code

hadoop - Sqoop - 是否可以在 HDFS 中导入平面文件

我知道可以通过sqoop将RDBM的数据导入HDFS，但我想知道是否也可以导入平面文件。例如，是否可以从远程Linux文件系统导入文件？感谢您的帮助。最佳答案要将平面文件放入HDFS，不需要Sqoop，我看不出有任何理由为此使用Sqoop。只需尝试以下命令。Here是相同的文档。hadoopfs-put 关于hadoop-Sqoop-是否可以在HDFS中导入平面文件，我们在StackOverflow上找到一个类似的问题： https://stackover

中导 hadoop section stackoverflow hdfs bigdata sqoop

hadoop - 执行 sqoop 作业时覆盖多个 sqoop 属性

我发现在运行时覆盖sqoop作业属性时，我只能覆盖一个属性。例子1:如果我提交sqoopjob--exectest123----query"select*fromtestwhereupdate_batch_idbetween4and10and\$CONDITIONS"----last-value3它只覆盖查询属性例子2:如果我提交sqoopjob--exectest123----last-value3----query"select*fromtestwhereupdate_batch_idbetween4and10and\$CONDITIONS"它仅覆盖查询属性的最后一个值属性。是否可

sqoop hadoop section code hadoop2 cloudera-cdh sqoop2

linux - 乌兹 : Sqoop dynamic target directory

我正在执行Oozie工作流中的sqoop作业。我可以在sqoop命令中创建具有静态名称的目标目录，如下所示。${jobTracker}${nameNode}job--execEMPLOYEE--meta-connectjdbc:hsqldb:hsql://:/sqoop----target-dir/user/test/Employee/20150126我需要创建带有日期的动态目标目录。我试过跟随，但没有用。${jobTracker}${nameNode}job--execEMPLOYEE--meta-connectjdbc:hsqldb:hsql://:/sqoop----target

乌兹 directory sqoop code lt linux hadoop oozie oozie-coordinator

sql - 更新 Sqoop 导出中的值

我正在使用Sqoopexport命令定期将数据从HDFS导出到sql数据库。这是我的专栏和示例数据Datesourcecount01-Feb-2015xxxx100我怀疑的是如果我在HDFS中有如下数据01-Feb-2015xxxx250我现在使用简单的导出命令。因此，在我的下一个导出操作数据库更新为Datesourcecount01-Feb-2015xxxx10001-Feb-2015xxxx250sqoop中是否有任何选项可以实现以下结果01-Feb-2015xxxx350 最佳答案如果你指定update-key，Sqoop就

Sqoop sql section code pre hadoop export

hadoop - map 减少作业在 sqoop 导入期间卡住

在运行这个sqoop导入命令时sqoopimport--connectjdbc:mysql://localhost/training--usernametraining--passwordtraining--tablecityByCountry在clouderaVM4.1.1上mapreduce作业卡在终端打印的最后一行mapreduce.Job:运行作业:job_1450451392672_000115/12/1710:41:55INFOmapreduce.Job:跟踪作业的url:http://localhost.localdomain:8088/proxy/application

导入期卡住 section training 1450451392672 hadoop mapreduce sqoop

hadoop - 如何在使用 sqoop 摄取数据时屏蔽数据

我正在使用sqoop提取数据。有什么方法可以屏蔽sqoop中的任何特定列或修改每个单元格。例如:creditcardinfo7888-3333-2222-10021111-2342-1235-20902331-2131-2222-3421我希望数据在摄取后是这样的:creditcardinfoXXXX-XXXX-XXXX-1002XXXX-XXXX-XXXX-2090XXXX-XXXX-XXXX-3421或creditcardinfo100220903421在sqoop中有可能吗？我试图找出答案，但无法获得太多信息。最佳答案最简

摄取何在 section XXXX sqoop hadoop hadoop2 sqoop2 data-masking

sql-server - Sqoop & Hadoop - 如何在 lastmodified 模式下加入/合并 Sqoop 导入的旧数据和新数据？

背景:我在SQL服务器上有一个具有以下架构的表。可以更新现有行，新行也会添加到该表中。unique_id|user_id|last_login_date|count123-111|111|2016-06-1819:07:00.0|180124-100|100|2016-06-0210:27:00.0|50我正在使用Sqoop在lastmodified模式下添加增量更新。我的--check-column参数是last_login_date列。在我的第一次运行中，我将以上两条记录输入到Hadoop中-我们称其为当前数据。我注意到最后一个值(第一次导入的检查列的最大值)是2016-06-18

Sqoop 何在 strong section last_login_date sql-server hadoop merge hive

hadoop - 从配置单元到 teradata 的 Sqoop 导出不适用于时间戳字段

我正在尝试将一个文件从配置单元中导出一个文件，其中一个字段作为时间戳('2016-05-2102:00:00')到teradata。teradata中的数据类型是timestamp(0)，可以期待类似的格式。当我尝试使用sqoop导出它时，它给出了字符串到时间戳的转换错误。任何解决方法都将大有帮助。注意:String到teradata中的Varchar(256)工作。String到teradata中的timestamp(0)失败。Timestampinhivetotimestamp(0)interadata失败。日志:16/07/1212:24:20INFOmapreduce.Job:

配置单元到 teradata code java hadoop hive sqoop