草庐IT

多启动

全部标签

hadoop - Oozie 服务未启动

我有一个运行Map-ReduceV1的CDH4集群。当我尝试从tarball安装oozieCDh4并按照给出的说明进行配置时https://ccp.cloudera.com/display/CDH4DOC/Oozie+Installation#OozieInstallation-Configuringthehadoopversion在启动服务时,我在日志中收到以下错误INFO:StartingServletEngine:ApacheTomcat/6.0.3211Oct,201211:51:57PMorg.apache.catalina.startup.HostConfigdeployD

hadoop - HFileOutputFormat 是否启动 reducer ?

我使用HFileOutputFormat将CSV文件批量加载到hbase表中。我只有map而没有使用job.setNumReduceTasks(0)的reduce任务。但是我可以看到一个reducer在作业中运行,这个reducer是因为HFileOutputFormat而启动的吗?以前我在同一个工作中使用TableOutputFormat,其中从未运行过reducer。我最近重构了map任务以使用HFileOutputFormat,但现在经过此更改后,我可以看到一个reducer正在运行。其次,我在reducer中遇到了以下错误,这是我之前使用TableOutputFormat时没有

hadoop - 启动时读取Hadoop只读默认配置文件core-default.xml吗?

文档中描述的文件是只读的配置文件src/core/core-default.xml,是Hadoop在启动时使用的吗?一些文档说将此文件复制到conf/core-site.xml并进行更改,有些文档说只包含那些被更改的属性。如果是后者,那么core-default.xml文件似乎是必需的。 最佳答案 core-default.xml首先加载,然后core-site.xml覆盖在其上。core-site.xml将仅包含需要更改默认值的值。请参阅顶部的资源部分:http://hadoop.apache.org/docs/current/a

hadoop - 如何配置和重新启动在 Azure 上运行的 HDInsight 群集?

具体来说,我想更改在MicrosoftAzure上运行的HDInsight集群中每个节点的最大映射器数量和最大缩减器数量。我使用远程桌面登录到头节点。我编辑了头节点上的mapred-site.xml文件并更改了mapred.tasktracker.map.tasks.maximum和mapred.tasktracker.reduce.tasks.maximum值。我尝试重新启动头节点,但无法重新启动。我使用start-onebox.cmd和stop-onebox.cmd脚本来尝试启动/停止HDInsight。然后我运行了一个流式mapreduce,将所需数量的reducer传递给had

hadoop - 使用 ambari 读取后无法启动 NodeManager

所以我删除了我的主机,然后尝试再次添加它。DataNode工作正常,但我无法让Nodemanager工作。我在删除后用yum删除了hadoop-yarn包,然后使用ambari再次安装它。现在,当我尝试使用ambari启动Nodemanager时,出现以下错误:2014-05-2319:40:41,507-Execute['exportHADOOP_LIBEXEC_DIR=/usr/lib/hadoop/libexec&&/usr/lib/hadoop-yarn/sbin/yarn-daemon.sh--config/etc/hadoop/confstartnodemanager']{

hadoop - cassandra 上的 Nutch 2.3.1 无法启动

我正在尝试使用cassandra运行nutch2.3.1。按照http://wiki.apache.org/nutch/Nutch2Cassandra上的步骤操作.最后,当我尝试使用命令启动nutch时:bin/crawlurls/testhttp://localhost:8983/solr/2我得到以下异常:GeneratorJob:startingGeneratorJob:filtering:falseGeneratorJob:normalizing:falseGeneratorJob:topN:50000GeneratorJob:java.lang.RuntimeExceptio

hadoop - 手动启动hdp服务的顺序是什么?

我在通过Ambari启动所有服务来启动hortonworks服务时遇到一些问题,所以我决定手动启动这些服务,我不确定在启动这些服务时是否应该遵守顺序。我已经安装了几乎所有我们可以在hortonworks数据平台上找到的服务。 最佳答案 通过Ambari手动启动hortonworks数据平台服务,有个命令要尊重,如下link显示我们可以在HDP上使用的最频繁服务的列表:RangerKnoxZooKeeperHDFSYARNHBaseHiveMetastoreHiveServer2WebHCatOozieHueStormKafkaAtl

hadoop - 每当我停止和启动 hadoop 服务时都必须反复格式化 HDFS

我在单节点集群上安装了hadoop。当我使用start=all.sh启动所有hadoop服务时,一切正常。但是,每当我停止所有服务并重新启动hadoop服务时,都会出现以下异常,我必须再次重新格式化文件系统。现在我正在开发中,每当我重新格式化时我都会复制文件。但是我不能在生产中出现这种行为。我检查了日志,这里是异常(exception)。我的etc/hosts文件也是一样的,我禁用了IPV62012-11-0318:49:45,542INFOorg.apache.hadoop.hdfs.server.namenode.NameNode:STARTUP_MSG:/************

java - 在单元测试中启动一个简单的独立 hadoop 服务器

背景:我正在尝试将Hive查询作为我们测试框架的一部分进行测试。我想创建简短的测试来测试一小部分数据,以便查询快速返回,并能够在每台计算机(甚至是私有(private)笔记本电脑)上运行它们。目标是能够只检查代码、使用Maven构建并运行测试。问题:有没有一种方法可以让我仅使用java代码启动独立的hadoop(或某种模拟器),而无需下载和安装可以作为测试的一部分运行?我的目标是进行一个测试,在其@Before方法中在测试内部设置hadoop,并在测试结束时将其删除。 最佳答案 您看过MiniClusterapi(http://wi

postgreSql服务的window启动

CMD启动服务:D:\PostgreSQL\binpg_ctlregister-NPostgreSQL-D"D:\PostgreSQL\data#登录psql-Upostgres#验证输入select1;拓展:删除服务scdelete服务名称PostgreSQLUSER:postgresPWD:rootPORT:5432动PostgreSQL服务器3.1打开命令提示符“Windows”+"R"快捷键打开运行窗口,在输入框中输入"cmd"进入命令行窗口。图3-1输入"cmd"进入命令行窗口3.2弹出DOS运行窗口。PostgreSQL安装目录是"D:\PostgreSQL"中,输入"cd\DD: