Sqoop1

amazon-web-services - 我们可以使用 sqoop 将数据从 Hadoop (Hive) 导出到 Amazon Redshift

我有一个本地Hadoop集群，想将数据加载到AmazonRedshift。考虑到成本，Informatica/Talend不是一个选择，那么我们可以利用Sqoop直接将表从Hive导出到Redshift吗？Sqoop是否连接到Redshift？最佳答案将数据加载到AmazonRedshift中的最有效的方法是将数据放入AmazonS3，然后在Redshift中发出COPY命令。这会在所有Redshift节点上执行并行数据加载。虽然Sqoop可以使用传统的INSERTSQL命令将数据插入Redshift，但这并不是将数据插入Red

sql-server - Sqoop 导出到 SQL Server : schemas?

我想将HDFS中的数据导出到架构my_schema中的SQLServer表。我试过像导入命令一样的--schema:sqoopexport\--libjars/opt/mapr/sqoop/sqoop-1.4.6/lib/sqljdbc4.jar\--connect"jdbc:sqlserver://MY-SERVER-DNS;database=my_db;"\--schema"myschema"\--table"my_table"\--export-dir/path/to/my/hdfs/dirERRORtool.BaseSqoopTool:Unrecognizedargument:

sql-server schemas code schema sqoop hadoop hdfs

hadoop - Apache Sqoop 和 Flume 可以互换使用吗？

我是大数据的新手。来自What'sthedifferencebetweenFlumeandSqoop?的一些答案，Flume和Sqoop都可以从源中拉取数据并推送到Hadoop。任何人都可以指定使用flume和sqoop的确切位置吗？两者都可以用于相同的任务吗？最佳答案 Flume和Sqoop两者都设计用于处理不同类型的数据源。Sqoop可与任何支持JDBC连接的RDBMS系统一起使用。另一方面，Flume可以很好地处理流式数据源，例如在您的环境中不断生成的日志数据。具体来说，Sqoop可用于将数据导入/导出RDBMS系统，例如O

hadoop Apache li noreferrer section bigdata sqoop flume

hadoop - "Got error creating database manager"- sqoop 导入查询出错

场景:我正在尝试从sqlserver导入到HDFS，但出现以下错误:错误:hadoop@ubuntu:~/sqoop-1.1.0/bin$./sqoopimport--connect'jdbc:sqlserver://192.168.230.1;username=xxx;password=xxxxx;database=HadoopTest'--tablePersonInfo--target-dir/home/hadoop/hadoop-0.21.0/11/12/1012:13:20ERRORtool.BaseSqoopTool:Goterrorcreatingdatabasemanag

amp creating sqoop cloudera hadoop

oracle - sqoop 不导入数据类型 varchar2

sqoop不导入数据类型varchar2到hadoop我在oracle数据库中有一个表，我想将数据导入到hdfs。我正在尝试使用sqoop进行操作，但未导入varchar2列。我的意思是这些数据没有到达hdfs文件。我的sqoop命令sqoopimport-Dmapred.job.name='defaultoraoop'--driveroracle.jdbc.driver.OracleDriver--connect"jdbc:oracle:thin:MyIp:MyServiceName"--username"XXXX"--password"XX"--target-dir"My_dir"

varchar2 varchar section strong 34 oracle hadoop hdfs sqoop

hadoop - Sqoop 增量导入到 S3 Wrong FS 报错

使用--incrementalappend时sqoopimport中的标志,作业将失败。ERRORtool.ImportTool:ImportedFailed:WrongFS:s3n://:@bucket/folder/完整命令如下:sqoopimport--connectjdbc:postgresql://someplace.net:12345/db--warehouse-dirs3n://:@bucket/folder/--tablemy_table--hive-drop-import-delims--escaped-by"\\"--usernameroot--passwordsa

hadoop Sqoop lib jar cloudera

hadoop - Sqoop 导入 : composite primary key and textual primary key

堆栈:使用Ambari2.1安装HDP-2.3.2.0-2950源数据库模式在sqlserver上，它包含几个表，这些表的主键为:一个变量复合-两个varchar列或一个varchar+一个int列或两个int列。有一张大table？三行PK中的列一个int+两个varchar列根据Sqoop文档:Sqoopcannotcurrentlysplitonmulti-columnindices.Ifyourtablehasnoindexcolumn,orhasamulti-columnkey,thenyoumustalsomanuallychooseasplittingcolumn.第一个

primary composite code 射器分列 hadoop hive sqoop hortonworks-data-platform hadoop-partitioning

hadoop - 好像您正在使用 JRE 运行 sqoop - 但 JAVA_HOME 设置为 JDK

我尝试在Ubuntu上设置sqoop(sqoop-1.4.3.bin__hadoop-1.0.0)。我可以毫无问题地运行基本的sqoop帮助等。当我运行以下命令时出现错误:sqoopimport--connectjdbc:mysql://localhost/test--tablesales-m113/04/1910:35:24INFOorm.CompilationManager:HADOOP_MAPRED_HOMEis/opt/hadoop/hadoop-1.0.413/04/1910:35:24ERRORorm.CompilationManager:Itseemsasthoughyo

JAVA_HOME hadoop CompilationManager section java sqoop

hadoop - 如何更改 sqoop Metastore？

我使用的是sqoop1.4.2版本。我正在尝试将sqoopMetastore从默认的hsqldb更改为mysql。我在sqoop-site.xml文件中配置了以下属性。sqoop.metastore.client.enable.autoconnectfalseIftrue,Sqoopwillconnecttoalocalmetastoreforjobmanagementwhennoothermetastoreargumentsareprovided.sqoop.metastore.client.autoconnect.urljdbc:mysql://ip:3206/sqoop?crea

Metastore hadoop sqoop HsqldbJobStorage hive bigdata sqoop2

hadoop - 我们如何在 SQOOP 中自动化增量导入？

我们如何在SQoop中自动执行增量导入？在增量导入中，我们需要给--last-value从最后一个值开始导入，但我的工作是经常从RDBMS导入，我不想手动给出最后一个值，有没有什么方法可以使这个过程自动化？最佳答案 @DurgaViswanathGadiraju回答的另一种方法。如果您正在将数据导入到配置单元表中，您可以从配置单元表中查询最后更新的值并将该值传递给sqoop导入查询。您可以使用shell脚本或oozie操作来实现此目的。外壳脚本:lastupdatedvalue=`hive-e'selectlast_valuefr

何在 hadoop gt lt 34 mapreduce sqoop

44 45 464748 49 50