SQOOP_CONF_DIR

hadoop - Couchbase/hadoop 连接器 : sqoop job FAILED "Found interface org.apache.hadoop.mapreduce.TaskAttemptContext, but class was expected"

我的配置:CouchBase服务器2.0Sqoop1.4.2(为hadoop版本2.0.0编译)栈HadoopCDH4.1.2我想使用CouchBase/Hadoop连接器(http://www.couchbase.com/develop/connectors/hadoop)，但是当我启动导入时出现以下错误:sqoop-import--connecthttp://localhost:8091/pools--tableDUMP13/01/0711:00:34INFOtool.CodeGenTool:Beginningcodegeneration13/01/0711:00:34INFOor

apache - Cloudera hadoop的conf目录在哪里？

我一直在寻找ClouderaHadoop/conf目录所在的位置，但找不到。我使用Cloudera的一键式软件包存储库安装了namenode，并运行了sudoapt-getinstall-yhadoop-hdfs-namenode，但现在我需要找到code>/conf这样我就可以配置Hadoop集群了。有人知道它在哪里吗？最佳答案它在通常的地方，/etc/hadoop/conf。您会发现这实际上是一个使用alternatives的符号链接(symboliclink)，但您可以根据需要转到此目录查找/编辑配置。不过，通过Cloud

Cloudera apache code section hadoop

hadoop - Sqoop 导入问题 - java.lang.IncompatibleClassChangeError : Found class org. apache.hadoop.mapreduce.JobContext，但接口(interface)是预期的

我正在使用Sqoop1.4.3与hadoop1.2.4和hive0.11.0当我尝试执行sqoop导入时:它抛出了IncompatibleClassChangeError。任何解决这个问题的建议..使用的Sqoop命令:sqoopimport--connectjdbc:mysql://localhost:3306/employees\--usernametest--passwordtest跟踪:Exceptioninthread"main"java.lang.IncompatibleClassChangeError:Foundclassorg.apache.hadoop.mapredu

hadoop IncompatibleClassChangeError apache java org sqoop

hadoop - "dfs.replication"和 "dfs.datanode.data.dir"配置如何在集群中工作？

我已按照Apache“单节点设置”说明在单节点上设置dfs.replication。但是后来我按照“ClusterSetup”进行操作，但它没有提到这个属性，所以我不知道这是要在Namenode上设置的属性，还是也/仅在Datanodes上设置的属性..我还读到在数据节点上的dfs.datanode.data.dir中设置多个(逗号分隔)路径将复制所有路径上的数据。所以我的问题是:dfs.replication将对哪个节点产生影响，如果dfs.datanode.data.dir的多个路径是设置，这些额外的独立复制是否仅针对每个数据节点，或者这些是否也以某种方式与dfs.replicat

中工 amp strong code replication hadoop hdfs

tomcat - 无法让 Sqoop 1.99.3 在 64 位 Centos 6.5 上与 Apache Hadoop 2.4.0 一起工作

我在Centos6.5KVM虚拟服务器上运行并安装了Apachehadoop。它安装在/home/hduser/yarn/hadoop-2.4.0andtheconfigfilesarein/home/hduser/yarn/hadoop-2.4.0/etc/hadoop.我从hadoop那里收到关于库是32位的投诉(猜测二进制安装默认包含这些)所以我做了一个完整的源代码构建以获得64位库。但似乎sqoop1.99.3无论如何只想使用hadoopjar..(?)这似乎是主要错误，似乎也是一个流行的错误，但我找不到任何有效的建议。addtowar.sh不在我的sqoop安装中**Caus

tomcat Centos apache catalina java hadoop sqoop

postgresql - Sqoop+PostgreSQL : how to prevent quotes around table name

我正在尝试将一个表从Postgresql导入到HDFS上的一个Parquet文件。这是我的做法:sqoopimport\--connect"jdbc:postgresql://pg.foo.net:5432/bar"\--usernameuser_me--password$PASSWORD\--tablefoo.bar\--target-dir/user/me/bar\--as-parquetfile我明白了INFOmanager.SqlManager:ExecutingSQLstatement:SELECTt.*FROM"foo.bar"AStLIMIT1ERRORmanager.S

postgresql code section bar hadoop jdbc sqoop cloudera-cdh

hadoop - 如何保护Sqoop中的密码和用户名？

我想隐藏我用来将数据从RDBMS导入Hadoop集群的密码。我正在使用--option-files将我的密码和用户名保存在文本文件中，但它不protected。我可以对该特定文件进行某种加密以获得更好的保护吗？最佳答案向数据库提供密码的安全方式。Youshouldsavethepasswordinafileontheusershomedirectorywith400permissionsandspecifythepathtothatfileusingthe--password-fileargument,andistheprefe

hadoop Sqoop section password the

amazon-web-services - 我们可以使用 sqoop 将数据从 Hadoop (Hive) 导出到 Amazon Redshift

我有一个本地Hadoop集群，想将数据加载到AmazonRedshift。考虑到成本，Informatica/Talend不是一个选择，那么我们可以利用Sqoop直接将表从Hive导出到Redshift吗？Sqoop是否连接到Redshift？最佳答案将数据加载到AmazonRedshift中的最有效的方法是将数据放入AmazonS3，然后在Redshift中发出COPY命令。这会在所有Redshift节点上执行并行数据加载。虽然Sqoop可以使用传统的INSERTSQL命令将数据插入Redshift，但这并不是将数据插入Red

amazon-web-services Redshift strong section hadoop etl sqoop

hadoop - yarn.log.dir 在哪里定义的？

在yarn-default.xml对于ApacheHadoop3.0.0，它将yarn.nodemanager.log-dirs的默认值显示为${yarn.log.dir}/userlogs。yarn.log.dir在哪里定义的？它有默认值吗？我没有在任何默认配置(core-default.xml、hdfs-default.xml、mapred-default.xml、yarn-default.xml)中找到它。我没有在任何环境脚本(hadoop-env.sh、httpfs-env.sh、kms-env.sh、mapred-env.sh、yarn-env.sh)中找到它。同样让我感到困

hadoop yarn default section logging hadoop-yarn

sql-server - Sqoop 导出到 SQL Server : schemas?

我想将HDFS中的数据导出到架构my_schema中的SQLServer表。我试过像导入命令一样的--schema:sqoopexport\--libjars/opt/mapr/sqoop/sqoop-1.4.6/lib/sqljdbc4.jar\--connect"jdbc:sqlserver://MY-SERVER-DNS;database=my_db;"\--schema"myschema"\--table"my_table"\--export-dir/path/to/my/hdfs/dirERRORtool.BaseSqoopTool:Unrecognizedargument:

sql-server schemas code schema sqoop hadoop hdfs

90 91 929394 95 96