Sqoop

shell - 如何获取基于 HIVE-SQOOP 的批处理作业的异常、错误、日志？

我的Hadoop集群有6个数据节点和1个名称节点。我在HIVE中几乎没有(4)个工作，这些工作每天都在运行，并使用sqoop将一些数据从日志文件推送到我们的OLPT数据库。我没有在环境中安装oozie。所有这些都写在HIVE脚本文件(.sql文件)中，我从unix脚本(.sh文件)运行它们。这些shell脚本文件附加有不同的操作系统cron作业，以便在不同的时间运行它们。现在要求是这样的:每天分别为每个作业生成日志/状态。因此，在一天结束时查看这些日志，我们可以确定哪个作业成功运行以及运行所花费的时间，哪个作业失败以及该失败作业的转储/堆栈状态。(功能计划是我们将拥有邮件服务器和每个失

oracle - Sqoop Oracle Import 不创建表

我想使用Sqoop将数据从Oracle数据库导入到Hive。我希望Sqoop将表创建到目标Hive数据库中。我把OracleJDBC(ojdbc6.jar)放到了Sqooplib目录下。我尝试了这两种方法，但都不起作用。sqoopimport\--connectjdbc:oracle:thin:@${DB_HOST}:${DB_PORT}:${DB_NAME}\--username${DB_USER}\--password${DB_PWD}\--table${INPUT_TABLE}\--hcatalog-home/usr/hdp/current/hive-webhcat\--hcat

oracle manager DEBUG table hadoop sqoop

mysql - 带日期的 Sqoop psql 查询

您好，我在使用swoop和psaldb查询时遇到问题Sqoopimport--connect'jdbc:postgresql://xx.xx.xxx.xx:xxxxx/database'--query'select*fromreportwheretransact_time='20160603-00:00:01'and$CONDITIONS'--usernameuname--target-dir/user/x/data--split-bytransact_time我收到以下错误:Errorexecutingstatement:org.postgresql.util.PSQLExcepti

mysql Sqoop code section CONDITIONS postgresql hadoop

sql-server - Sqoop 无法从 Sql Server 导入数据

sqoopimport--driver="com.microsoft.jdbc.sqlserver.SQLServerDriver"--connect="jdbc:microsoft:sqlserver://**.**.**.**:1433/DB_Schema;IntegratedSecurity=TRUE"--tabledbo.TABLE_NAME错误一:--driverissettoanexplicitdriverhoweverappropriateconnectionmanagerisnotbeingset(via--connection-manager).Sqoopisgoin

sql-server server blockquote code section hadoop import sqoop

hadoop - sqoop 在导入时如何处理更新的行？

如果Oracle(或任何RDBMS)中有一个表包含每天刷新的数据。例子:1234,Raj,Kolkata,1000,09092015假设，我今天使用标准sqoop导入导入这一行，并以平面文件的形式存储在HDFS中。第二天，该行从源表中删除。但是如果在7天后更新了相同的记录(比如sal字段1000更新为2000)。如果我再次运行sqoop查询，它将如何处理数据以及如何存储？是否会有相同记录的两个条目或将更新较新的值？会不会记录会被这个取代吗？最佳答案如果您执行incrementalimports在Sqoop中，您可以通过使用参数-

入时何处 code 新行 section hadoop sqoop bigdata

hadoop - Sqoop 函数 '--map-column-hive' 被忽略

我正在尝试将文件作为parquet导入到配置单元中，而--map-column-hivecolumn_name=timestamp被忽略。column_name列最初是sql中的datetime类型，它在parquet中将其转换为bigint。我想通过sqoop将它转换为时间戳格式，但它不起作用。sqoopimport\--tabletable_name\--drivercom.microsoft.sqlserver.jdbc.SQLServerDriver\--connectjdbc:sqlserver://servername\--usernameuser--passwordpw\

map-column-hive amp section column hive hadoop sqoop

hadoop - 为什么 sqoop 尝试使用 SELECT WITH GRANT？

我正在尝试从teradata数据库进行sqoop。我使用了以下调用:sqoopimport--connectjdbc:teradata://>/database=>,LOGMECH=>--connection-manager"com.cloudera.connector.teradata.TeradataManager"--username>-P--target-dir>--query'SELECT*FROM>.>WHERE$CONDITIONSsample10'--split-by>--hive-import--hive-database>--hive-table>出现以下错误:16

hadoop SELECT gt lt code hive teradata

hadoop - 为什么 sqoop 将导入中的 DECIMAL 类型从 Teradata 映射到 DOUBLE？

我有Sqoop版本:1.4.6当将数据从Teradata导入Hive时，我发现DECIMAL类型被转换为DOUBLE。我想知道为什么Hive具有完全等效的数据类型。最佳答案这是因为他们为所有RDBMS通用地编写了它。DECIMAL映射为DOUBLE。sourcecode的有用部分:publicstaticStringtoHiveType(intsqlType){switch(sqlType){caseTypes.INTEGER:caseTypes.SMALLINT:return"INT";caseTypes.VARCHAR:ca

Teradata DECIMAL Types case section hadoop hive sqoop

hadoop - 是否可以在 sqoop 类型映射中指定 DECIMAL 比例和精度？

我正在尝试通过sqoop选项指定列类型映射:--map-column-hive>=DECIMAL$15,2$但这会返回错误:Columnmappingshouldbetheformkey=value[,key=value]*如果我删除小数位数和精度值(以及括号)，那会起作用，但它默认为DECIMAL(10,0)。我需要能够指定实际值。我正在运行Sqoop版本:1.4.6 最佳答案 Sqoop1.4.7中修复了这个错误修复并不简单。例如，对于col3=decimal(1,1)列，需要编写col3=decimal(1%2C1)检查S

射中 DECIMAL section code hadoop hive sqoop

hadoop - 除了SQOOP之外，还有什么方法可以从RDBMS传输到HDFS吗？

除了使用sqoop将RDBMS传输到HDFS之外，我想要其他方法请给我线索请任何人给我解释一下，hive和sqoop之间的关系是什么？最佳答案添加到devツ的答案中，您还有一个名为streamsets数据收集器的工具，它可以帮助您通过创建JDBC连接从mysql获取数据到HDFS。关于hadoop-除了SQOOP之外，还有什么方法可以从RDBMS传输到HDFS吗？，我们在StackOverflow上找到一个类似的问题： https://stackover

hadoop SQOOP section 收集器 stackoverflow

23 24 252627 28 29