project-hosting

hadoop - 在配置单元 "Unable to retrieve URL for Hadoop Task logs. Does not contain a valid host:port authority: local"上出现错误

在涉及mapreduce的hive上执行任何查询时，我收到此错误。“UnabletoretrieveURLforHadoopTasklogs.Doesnotcontainavalidhost:portauthority:local” 最佳答案报告的异常出现在旧版本的Hadoop中(即YARN之前)。大多数情况下，您使用的是旧版本的Hadoop。当mapred.job.tracker的值出现异常参数在local中设置为“mapred-site.xml”相反，它应该是:. 关于hadoop

maven - 奥齐 : Could not resolve dependencies for project org. Apache .奥齐 :oozie-sharelib-oozie:jar:4. 0.1

我在尝试构建oozie时遇到错误。Hadoop版本:Hadoop2.4.0JDK:1.8我使用这个命令来运行oozie:./mkdistro.sh-DskipTests运行上面的代码会出现以下错误:我不确定发生了什么问题。[INFO]ReactorSummary:[INFO][INFO]ApacheOozieMain.................................SUCCESS[3.519s][INFO]ApacheOozieClient...............................SUCCESS[1:27.702s][INFO]ApacheOozie

oozie oozie-sharelib-oozie apache org maven hadoop

hadoop - Apache pig -错误 2229 : Couldn't find matching uid -1 for project

运行Pig脚本时出现以下异常。ERROR2229:Couldn'tfindmatchinguid-1forproject(Name:ProjectType:bytearrayUid:-1Input:0Column:12)org.apache.pig.impl.logicalLayer.FrontendException:ERROR2000:ErrorprocessingruleColumnMapKeyPrune.Try-tColumnMapKeyPruneatorg.apache.pig.newplan.optimizer.PlanOptimizer.optimize(PlanOpti

matching project apache java org hadoop apache-pig cloudera-cdh

Hadoop安装配置 : multiple versions side-by-side on same host

能否在同一个系统上以伪分布式的方式安装不同版本的Hadoop？其实我想探索不同版本的hadoop-1.x和hadoop-2.x的特性，我已经在运行Linux的两个不同系统上配置了hadoop-1.x和hadoop-2.x。有什么方法可以在同一台机器上配置吗？最佳答案是的，可以在同一台主机上并排安装多个版本的Hadoop软件。将不同版本的Hadoop软件提取到单独的子目录中。为不同的版本创建单独的配置文件(core-site.xml、hdfs-site.xml、yarn-site.xml等)，并将这些文件集保存在单独的目录中。确保

side side-by-side code section Hadoop hadoop2

hadoop - YARN 提示 java.net.NoRouteToHostException : No route to host (Host unreachable)

尝试在HDP3.1集群上运行h2o并遇到似乎与YARN资源容量有关的错误...[ml1user@HW04h2o-3.26.0.1-hdp3.1]$hadoopjarh2odriver.jar-nodes3-mapperXmx10gDeterminingdriverhostinterfaceformapper->drivercallback...[PossiblecallbackIPaddress:192.168.122.1][PossiblecallbackIPaddress:172.18.4.49][PossiblecallbackIPaddress:127.0.0.1]Usingm

NoRouteToHostException unreachable 1564020515809 application hadoop hadoop-yarn h2o

ubuntu - 什么是 127.0.0.1. 127.0.0.1代表在/etc/hosts ubuntu？

每次我尝试安装一些apachehadoop、hbase。127.0.0.1localhost127.0.1.1ubuntu-host通常建议您注释本地主机部分并在/etc/hosts文件中使用127.0.0.1ubuntu-host。如果我同时使用怎么办127.0.0.1localhost,ubuntu-host这有什么问题吗？此外，建议在集群中禁用ipv6。如果我使用默认主机文件和ipv6enablbe会怎样？它会导致任何问题吗？最佳答案通过这个page.它很好地解释了为什么HBase关心/etc/hosts。就IPv6而言，

ubuntu 127 section ubuntu-host hadoop hive

hadoop - Cloudera CDH4 : Can't add a host to my cluster because canonical name is not consistent with hostname

我正在使用Ubuntu12.04LTS在4节点集群上安装CDH4。我能够安装cloudera管理器并在主机上启动单节点集群。但是，一旦我添加了一个新主机，CM就会说它运行状况不佳并抛出以下错误:“从Java进程检查时，此主机的主机名和规范名称不一致。”我修改了master和所有主机上的/etc/hosts的内容，以包含IP地址，后跟每台机器的FQDN。我是否还需要设置一个DNS服务器才能完成这项工作？最佳答案您不一定需要设置DNS服务器才能使其正常工作，但正向和反向DNS必须明确匹配Hadoop才能正常运行。Hadoop操作书有

consistent canonical section amp 反向 hadoop ubuntu-12.04 cloudera

hadoop - "Hadoop-Solr Lucidworks Project"检索输入名称路径

我正在使用这个项目:https://github.com/lucidworks/hadoop-solr有谁知道在哪个值中保存了正在处理的文档的名称(或路径)。我想将此值检索到SolrAdmin(将一个字段及其名称添加到我的架构中)。这可能吗？示例:我希望能够看到文档的名称，查询从中返回相同的结果。我正在使用此命令运行项目:hadoopjarsolr-hadoop-job-2.2.5.jarcom.lucidworks.hadoop.ingest.IngestJob-Dlww.commit.on.close=true-DcsvDelimiter=-clscom.lucidworks.ha

Hadoop-Solr Lucidworks hadoop section solr

hadoop - 如何配置hadoop使用非默认端口: "0.0.0.0: ssh: connect to host 0.0.0.0 port 22: Connection refused"

当我运行start-dfs时，出现以下错误，看起来我需要告诉hadoop使用不同的端口，因为这是我通过ssh进入本地主机时所需要的。换句话说，以下操作成功:ssh-p2020localhost.[WedJan0616:57:34root@~]#start-dfs.sh16/01/0616:57:53WARNutil.NativeCodeLoader:Unabletoloadnative-hadooplibraryforyourplatform...usingbuiltin-javaclasseswhereapplicableStartingnamenodeson[localhost]l

hadoop Connection gt lt code

hadoop - Flume 代理 : add host to message, 然后发布到 kafka 主题

我们开始通过向Kafka主题发布消息来整合应用程序的事件日志数据。虽然我们可以直接从应用程序写入Kafka，但我们选择将其视为一般问题并使用Flume代理。这提供了一些灵active:如果我们想从服务器捕获其他内容，我们可以拖尾不同的来源并发布到不同的Kafka主题。我们创建了一个Flume代理配置文件来跟踪日志并发布到Kafka主题:tier1.sources=source1tier1.channels=channel1tier1.sinks=sink1tier1.sources.source1.type=exectier1.sources.source1.command=tail-

message hadoop channel channels tier1 apache-kafka flume flume-ng

125 126 127128129 130 131