Sqoop-Export

hadoop - 如何使用sqoop覆盖hive中的数据

我正在尝试通过sqoop从mysql数据库将数据加载到配置单元中已经存在的表中。我指的是以下指南以供引用:-http://sqoop.apache.org/docs/1.4.5/SqoopUserGuide.html#_importing_data_into_hive--hive-import已成功试用和测试。我创建了一个配置单元表如下:-createtablesqoophive(idint,namestring,locationstring)rowformatdelimitedfieldsterminatedby'\t'linesterminatedby'\n'storedastex

hadoop - Sqoop导入多个表但不是全部

我发现的所有搜索都显示了如何导入一个表或推荐导入所有表。如果我想从我的数据库中获取440个表中的35个怎么办？我可以只写一个命令并用逗号分隔表，还是必须将它放在脚本中并一遍又一遍地复制和粘贴命令并每次都更改表名？我想做的事情:echo"SqoopImport"--options-file${path}--tabletbl1,tbl2,tbl3\--target-dir${path}--m1\我担心我可能不得不做的事情:echo"SqoopImport"--options-file${path}--tabletbl1\--target-dir${path}--m1waitecho"Sqo

hadoop Sqoop section path options-file data-ingestion

hadoop - 如何每天将增量记录从 Oracle 加载到 HDFS，我们可以使用 Sqoop 或 MR Jobs。哪个是首选方法

如何每天从Oracle加载增量记录到HDFS？我们可以使用Sqoop或MRJobs吗？最佳答案 Sqoop正是为此目的而设计的，并且会导致MR作业完成复制数据的工作。有多种方法可以确定Oracle表中的新内容，例如使用表的ID，或者可能使用日期修改字段(如果有的话)。与Hadoop中的大多数东西相比，Sqoop相当简单。这是文档的链接——搜索“增量”或从第7.2.9节开始了解更多信息。http://sqoop.apache.org/docs/1.4.6/SqoopUserGuide.html仅供引用一旦您使其正常工作，请查看设计用

首选 hadoop section Oracle Sqoop hive hdfs

database - 我无法通过 sqoop 所有表在 sqoop 中导入数据

[cloudera@quickstart~]$**sqoopimport-all-tables-m=4--connect"jdbc:mysql://quickstart.cloudera:3306/retail_db"--username=retail_dba--password=cloudera--warehouse-dir=/user/cloudera/sqoop-import**Warning:/usr/lib/sqoop/../accumulodoesnotexist!Accumuloimportswillfail.Pleaseset$ACCUMULO_HOMEtotheroo

中导 sqoop INFO cloudera mapreduce database hadoop

hadoop - 使用带有 Oozie 的 sqoop 观察重复项

我已经构建了一个sqoop程序，以便使用预构建的sqoop作业将数据从MySQL导入HDFS:sqoopjob-fs$driver_path-Dmapreduce.map.java.opts="-Duser.timezone=Europe/Paris"\--createjob_parquet_table--import-m$nodes_number\--connectjdbc:mysql://$server:$port/$database--username$username--password-file$pass_file\--target-dir$destination_dir--

hadoop Oozie sqoop section noreferrer

hadoop - 运行 sqoop 导入时出错 - ERROR manager.OracleManager : Failed to rollback transaction

我正在使用sqoop将数据从oracledb加载到hive规范:CDH-5.5.1Sqoop1.4.2初始化:exportSQOOP_HOME=/opt/cloudera/parcels/CDH-5.5.1-1.cdh5.5.1.p0.11/lib/sqoopexportHIVE_HOME=/opt/cloudera/parcels/CDH-5.5.1-1.cdh5.5.1.p0.11/lib/hiveexportHADOOP_CLASSPATH=/opt/cloudera/parcels/CDH-5.5.1-1.cdh5.5.1.p0.11/lib/sqoop/lib/ojdbc7.

入时 OracleManager apache java sqoop hadoop hive

hadoop - 密码问题的 Sqoop 作业

Sqoop作业总是在CLI中提示输入密码。为了避免这种情况，据说应该将属性sqoop.metastore.client.record.password设置为true。但是到处都说我需要更改sqqop_site.xml中的这个值。无论如何我可以将这个值单独设置为一项工作。我尝试创建如下所示的作业，但sqoop无法创建它sqoopjob--createTEST-Dsqoop.metastore.client.record.password=true--import\--connectjdbc:netezza://xx.xxx.xx.xxx/database\--usernameuserna

hadoop Sqoop password section bigdata

shell - 如何获取基于 HIVE-SQOOP 的批处理作业的异常、错误、日志？

我的Hadoop集群有6个数据节点和1个名称节点。我在HIVE中几乎没有(4)个工作，这些工作每天都在运行，并使用sqoop将一些数据从日志文件推送到我们的OLPT数据库。我没有在环境中安装oozie。所有这些都写在HIVE脚本文件(.sql文件)中，我从unix脚本(.sh文件)运行它们。这些shell脚本文件附加有不同的操作系统cron作业，以便在不同的时间运行它们。现在要求是这样的:每天分别为每个作业生成日志/状态。因此，在一天结束时查看这些日志，我们可以确定哪个作业成功运行以及运行所花费的时间，哪个作业失败以及该失败作业的转储/堆栈状态。(功能计划是我们将拥有邮件服务器和每个失

HIVE-SQOOP shell code section strong hadoop hive sqoop hiveql

oracle - Sqoop Oracle Import 不创建表

我想使用Sqoop将数据从Oracle数据库导入到Hive。我希望Sqoop将表创建到目标Hive数据库中。我把OracleJDBC(ojdbc6.jar)放到了Sqooplib目录下。我尝试了这两种方法，但都不起作用。sqoopimport\--connectjdbc:oracle:thin:@${DB_HOST}:${DB_PORT}:${DB_NAME}\--username${DB_USER}\--password${DB_PWD}\--table${INPUT_TABLE}\--hcatalog-home/usr/hdp/current/hive-webhcat\--hcat

oracle manager DEBUG table hadoop sqoop

mysql - 带日期的 Sqoop psql 查询

您好，我在使用swoop和psaldb查询时遇到问题Sqoopimport--connect'jdbc:postgresql://xx.xx.xxx.xx:xxxxx/database'--query'select*fromreportwheretransact_time='20160603-00:00:01'and$CONDITIONS'--usernameuname--target-dir/user/x/data--split-bytransact_time我收到以下错误:Errorexecutingstatement:org.postgresql.util.PSQLExcepti

mysql Sqoop code section CONDITIONS postgresql hadoop

30 31 323334 35 36