草庐IT

SQOOP_CONF_DIR

全部标签

configuration - 在单节点集群上确定 Hadoop Conf 设置的一般方法

我想知道如何最好地确定适当数量的map和reduce任务以及JVM堆的相应最大大小?对于那些刚接触Hadoop的人来说,这些是在mapred-site.xml文件。有没有我可以根据(虚拟)内核和RAM的数量遵循的通用公式?在您的回复中,请考虑在作业之前/期间创建的各种其他Hadoop进程处理及其对RAM使用的影响(参见:https://forums.aws.amazon.com/thread.jspa?threadID=49024)从单机集群到双机集群,如何应对变化? 最佳答案 时间已经过去,没有人试图制定一个答案。所以我会提出一些

org.apache.hadoop.conf.Configuration.getLocalpath(配置)中的 java.lang.NullPointerException

有没有人遇到过这个问题?ThefollowingaretheerrorinformationwhenIrunthejob:13/01/1015:53:19INFOmapred.JobClient:TaskId:attempt_201301101540_0001_m_000010_0,Status:FAILEDjava.lang.NullPointerExceptionatorg.apache.hadoop.conf.Configuration.getLocalPath(Configuration.java:934)atnfs.iscas.sil.hcir.index.ImageInde

database - 使用 Sqoop 从 Sybase 导入数据的问题

我正在尝试使用Sqoop从Sybase导入数据。从日志中我可以说我已经成功地进行了连接。但是我的工作失败了,给了我一些来自Sybase的Sql异常。我主要不是在Sybase上工作,所以无法从这个错误中挖掘出太多信息。我的资源中只有一个位于Sybase。我使用了以下命令:sqoopimport--verbose\--drivercom.sybase.jdbc3.jdbc.SybDriver\--connectjdbc:sybase:Tds:nyhostx123.sm.com:13290/DATABASE=tempdb\--tabletempdb..mit\--split-bysipid\

hadoop - 运行 Hadoop 示例时出现错误 : package org. apache.hadoop.conf 不存在

我已经使用exportCLASSPATH=${CLASSPATH}:/~Downloads/hadoop-1.0.4/*.jar将hadoopjars添加到类路径中,但我仍然我收到找不到包的错误。我正在使用Java1.7.0_17。有人知道如何正确设置hadoopjar的类路径吗? 最佳答案 您要将它们设置到的不是CLASSPATH,而是HADOOP_CLASSPATH。我喜欢使用以下命令添加当前目录和lib目录中的所有jar依赖项:exportHADOOP_CLASSPATH=$HADOOP_CLASSPATH:`echo*.ja

hadoop - Oozie 和 sqoop 配置问题

我正在尝试设置oozie和sqoop工作流(我想将mySql数据备份到我的hdfs中)。但是当我尝试开始我的工作时,我遇到了困难。我正在使用hadoop2(工作中的hdfs节点),oozie的最新版本。我在我的电脑上安装了oozie服务器(我想在部署它之前测试它),在oozieconf/haddop-conf目录)和我在服务器上的hdfs。我做了一个基本的工作流程(测试目的,我只是想看看sqoop是否工作)是这样的:yarn.resourcemanager.address:8040hdfs://hdfs-server:54310job--listActionfailed,errorme

mysql - sqoop从hdfs导出到mysql是否保留分区

我已经创建了一个多节点hadoop集群并在其上安装了hive。另外,我在另一台远程机器上安装了MySQL。我打算将存储在HDFS中的数据导出到关系型数据库MySQL中。我研究了如何使用Sqoop完成此操作。所以我发现我需要在MySQL中创建一个表,该表具有相同顺序的目标列(与Hive中存在的一样),并具有适当的SQL类型。然后使用sqoopexport命令。我的问题是:如果表在Hive中分区,并且在MySQL中创建表时我相应地对其进行分区,sqoopexport命令会保留分区吗?我的问题类似于sqoopexportmysqlpartition.我想知道分区支持是否已添加到sqoop。这

hadoop - Nutch 2.0 和 Hadoop。如何防止缓存 conf/regex-urlfilter.txt

我在一台机器上安装了nutch2.x和hadoop1.2.1。我配置seed.txt、conf/regex-urlfilter.txt并运行命令crawlurls/seed.txtTestCrawlhttp://localhost:8088/solr/2然后我想更改conf/regex-urlfilter.txt中的规则我在2个文件中更改了它:~$find.-name'regex-urlfilter.txt'./webcrawer/apache-nutch-2.2.1/conf/regex-urlfilter.txt./webcrawer/apache-nutch-2.2.1/runt

mysql - 使用 sqoop 将 float 和 double 从 hdsf 导出到 MySql 时出现问题

我正在使用hadoop版本1.2.1和sqoop1.4.4我是hadoop/sqoop的新手,遇到了问题。我在hdfs中有数据要导出到MySQL,但导出一直失败。我使用的语句是:sqoopexport--connectjdbc:mysql://{ipaddress}/{database}--usernameusername-P--table{tablename}--export-dir{export-dir}--input-fields-terminated-by','--lines-terminated-by'\n'--verbose我得到的错误是:14/02/2810:12:40I

hadoop - Sqoop 错误外来输入 't1' 期望 EOF 接近 '<EOF>'

我正在尝试将一些数据从Hive集群导入到另一个具有多个映射器的HDFS集群。我正在使用以下命令导入数据。/opt/isv/app/pkgs/sqoop-1.4.4.bin__hadoop-1.0.0/bin/sqoopimport--connectjdbc:hive://XXXXXX.com:10000/strrecommender--driverorg.apache.hadoop.hive.jdbc.HiveDriver-e'从strrecommender.sltrn_dtl_full中选择upc_cd、sltrn_dt、sltrn_id、loc_id、pos_rgstr_id、hh

hadoop - 使用 sqoop 的 Oozie 工作流

我在我的系统中安装了oozie4.0.0和Hadoop1.2.1我的目标是在oozie中编写sqoop作业。正如我在谷歌上搜索并获得以下链接:-http://rvs.github.io/oozie/installing.htmlhttp://srikanthayalasomayajulu.blogspot.sg/2013/02/apache-oozie-331-installation-on-apache.htmlwww.tanzirmusabbir.com/2013/05/chunk-data-import-incremental-import-in.html所有链接都非常好。我面临