草庐IT

remote-host-num

全部标签

hadoop - 无法启动 TaskTracker.Says 无法启动任务跟踪器,因为 java.lang.IllegalArgumentException : Does not contain a valid host:port authority:

编辑了mapred-site.xml、core-site.xml、hadoop-env.sh、hdfs-site.xml、masters和slaves。我有1个DataNode和2个Namenode。它们都成功启动,我可以在浏览器中看到它们。启动了start-mapred.sh并在Namenode上启动了JobTracker和TaskTracker,但无法在datanaode上启动Tasktracker。启动Tasktracker,输出如下。->hadooptasktrackerWarning:$HADOOP_HOMEisdeprecated.13/10/1703:21:55INFOm

hadoop -/etc/hosts文件如何影响datanode和namenode的连接?

我现在正在建立一个hadoop集群(4台机器包括1台运行namenode和jobTracker的master,3台运行dataNode和TaskTracker的slave)。但遗憾的是所有datanode无法连接到9000端口上的master。当我使用sudonetsat-ntlp,结果是:tcp000.0.0.0:521930.0.0.0:*LISTEN-tcp000.0.0.0:20490.0.0.0:*LISTEN-tcp000.0.0.0:392670.0.0.0:*LISTEN7284/rpc.mountdtcp000.0.0.0:332190.0.0.0:*LISTEN72

hadoop - 在配置单元 "Unable to retrieve URL for Hadoop Task logs. Does not contain a valid host:port authority: local"上出现错误

在涉及mapreduce的hive上执行任何查询时,我收到此错误。“UnabletoretrieveURLforHadoopTasklogs.Doesnotcontainavalidhost:portauthority:local” 最佳答案 报告的异常出现在旧版本的Hadoop中(即YARN之前)。大多数情况下,您使用的是旧版本的Hadoop。当mapred.job.tracker的值出现异常参数在local中设置为“mapred-site.xml”相反,它应该是:. 关于hadoop

Hadoop conf确定num map任务

我有一份工作,就像我所有的Hadoop工作一样,从我在Hadoop界面中看到的运行时,它似乎总共有2个maptask。但是,这意味着它加载了太多数据,以至于我收到Java堆空间错误。我已经尝试在我的Hadoop集群中设置许多不同的conf属性来将作业拆分为更多任务,但似乎没有任何效果。我试过设置mapreduce.input.fileinputformat.split.maxsize、mapred.max.split.size、dfs.block.size但似乎没有任何效果。我正在使用0.20.2-cdh3u6,并尝试使用cascading.jdbc运行作业-该作业无法从数据库读取数据

Hadoop安装配置 : multiple versions side-by-side on same host

能否在同一个系统上以伪分布式的方式安装不同版本的Hadoop?其实我想探索不同版本的hadoop-1.x和hadoop-2.x的特性,我已经在运行Linux的两个不同系统上配置了hadoop-1.x和hadoop-2.x。有什么方法可以在同一台机器上配置吗? 最佳答案 是的,可以在同一台主机上并排安装多个版本的Hadoop软件。将不同版本的Hadoop软件提取到单独的子目录中。为不同的版本创建单独的配置文件(core-site.xml、hdfs-site.xml、yarn-site.xml等),并将这些文件集保存在单独的目录中。确保

hadoop - YARN 提示 java.net.NoRouteToHostException : No route to host (Host unreachable)

尝试在HDP3.1集群上运行h2o并遇到似乎与YARN资源容量有关的错误...[ml1user@HW04h2o-3.26.0.1-hdp3.1]$hadoopjarh2odriver.jar-nodes3-mapperXmx10gDeterminingdriverhostinterfaceformapper->drivercallback...[PossiblecallbackIPaddress:192.168.122.1][PossiblecallbackIPaddress:172.18.4.49][PossiblecallbackIPaddress:127.0.0.1]Usingm

java - 如果 mapred.job.reuse.jvm.num.tasks 设置为 -1,则 hadoop 集群中每个节点启动了多少个 jvm

我最近看到了hadoop的mapred.job.reuse.jvm.num.tasks属性。默认情况下,它设置为+1,这意味着每个map/reduce任务都会启动一个新的JVM。相反,如果它设置为-1,那么一个jvm可以被无限数量的任务使用。在这种情况下,任务依次执行以使用相同的JVM。因此,当该属性设置为+1时,每个节点启动的JVM数量等于任务数量。没有混淆....但是,我的具体问题是,如果我将mapred.job.reuse.jvm.num.tasks设置为-1,每个节点将启动多少个JVM。每个节点只有一个JVM吗?还是别的? 最佳答案

ubuntu - 什么是 127.0.0.1. 127.0.0.1代表在/etc/hosts ubuntu?

每次我尝试安装一些apachehadoop、hbase。127.0.0.1localhost127.0.1.1ubuntu-host通常建议您注释本地主机部分并在/etc/hosts文件中使用127.0.0.1ubuntu-host。如果我同时使用怎么办127.0.0.1localhost,ubuntu-host这有什么问题吗?此外,建议在集群中禁用ipv6。如果我使用默认主机文件和ipv6enablbe会怎样?它会导致任何问题吗? 最佳答案 通过这个page.它很好地解释了为什么HBase关心/etc/hosts。就IPv6而言,

hadoop - Cloudera CDH4 : Can't add a host to my cluster because canonical name is not consistent with hostname

我正在使用Ubuntu12.04LTS在4节点集群上安装CDH4。我能够安装cloudera管理器并在主机上启动单节点集群。但是,一旦我添加了一个新主机,CM就会说它运行状况不佳并抛出以下错误:“从Java进程检查时,此主机的主机名和规范名称不一致。”我修改了master和所有主机上的/etc/hosts的内容,以包含IP地址,后跟每台机器的FQDN。我是否还需要设置一个DNS服务器才能完成这项工作? 最佳答案 您不一定需要设置DNS服务器才能使其正常工作,但正向和反向DNS必须明确匹配Hadoop才能正常运行。Hadoop操作书有

hadoop - 如何配置hadoop使用非默认端口: "0.0.0.0: ssh: connect to host 0.0.0.0 port 22: Connection refused"

当我运行start-dfs时,出现以下错误,看起来我需要告诉hadoop使用不同的端口,因为这是我通过ssh进入本地主机时所需要的。换句话说,以下操作成功:ssh-p2020localhost.[WedJan0616:57:34root@~]#start-dfs.sh16/01/0616:57:53WARNutil.NativeCodeLoader:Unabletoloadnative-hadooplibraryforyourplatform...usingbuiltin-javaclasseswhereapplicableStartingnamenodeson[localhost]l