草庐IT

return-address-labels

全部标签

Hadoop 设置问题 : "ssh: Could not resolve hostname now.: No address associated with hostname"

我基于vmware搭建hadoop集群,使用sbin/start-dfs.sh命令,遇到ssh问题。它说,ssh:Couldnotresolvehostnamenow.:Noaddressassociatedwithhostname我已经使用vi/etc/hosts命令检查主机名和IP地址,以及vi/etc/profile命令。我保证没有错。 最佳答案 一些建议检查hdfs-site.xml中的主机名是否设置正确。如果您使用单主机设置运行,并且将名称节点主机设置为本地主机,则需要确保本地主机映射到/etc/hosts中的127.0.

java - pig : UDF not returning expected resultset

这是我正在处理的示例数据:PeterWilkerson27MJamesOwen26MMattWo30MKennyChen28M我创建了一个简单的UDF来像这样过滤年龄:publicclassIsApplicableextendsFilterFunc{@OverridepublicBooleanexec(Tupletuple)throwsIOException{if(tuple==null||tuple.size()>0){returnfalse;}try{Objectobject=tuple.get(0);if(object==null){returnfalse;}intage=(In

hadoop - 使用 spark/scala,我使用 saveAsTextFile() 到 HDFS,但是 hiveql("select count(*) from...) return 0

我创建了如下外部表...hive-e"createexternaltabletemp_db.temp_table(achar(10),bint)PARTITIONEDBY(PART_DATEVARCHAR(10))ROWFORMATDELIMITEDFIELDSTERMINATEDBY'\t'STOREDASTEXTFILELOCATION'/work/temp_db/temp_table'"我在IntelliJIDEA中将saveAsTextFile()与scala一起使用,如下所示...itemsRdd.map(_.makeTsv).saveAsTextFile("hdfs://w

xml - 为什么 YARN 上会有 mapreduce.jobtracker.address 配置?

YARN是Hadoop的二代,不再使用jobtracker守护进程,取而代之的是资源管理器。但是为什么在mapred-site.xmlhadoop2上有一个mapreduce.jobtracker.address属性? 最佳答案 你是对的。在YARN中,jobtracker不再存在。因此,作为客户端配置的一部分,您不必指定属性mapreduce.jobtracker.address。在YARN中,您应该在配置文件中将属性mapreduce.framework.name指定给yarn。您无需设置mapreduce.jotracker.

hadoop - 异常 - java.lang.IllegalArgumentException : Label not found in Mahout

我正在运行以下命令,/mahouttrainnb-i${WORK_DIR}/20news-train-vectors-el-o${WORK_DIR}/model-li${WORK_DIR}/labelindex-ow./mahouttestnb-i${WORK_DIR}/20news-test-vectors-m${WORK_DIR}/model-l${WORK_DIR}/labelindex\-ow-o${WORK_DIR}/20news-testing在运行最后一个命令时,我能够将map任务运行到100%,但是在reduce任务上我收到以下错误:Exceptioninthread"

windows - 运行 MapReduce 作业时出错 : not a valid Inet address

我想尝试在Windows上使用Hadoop。我已将WindowsAzureHDInsightPreview作为单个节点安装在我的Windows7笔记本电脑上。仪表板和节点已启动并正在运行,并且HDFS正在运行。但是,当我运行MapReduce作业时,它失败并显示错误消息“不是有效的Inet地址”:c:\Hadoop\GettingStarted>powershell-ExecutionPolicyunrestricted/FrunSamples.ps1w3csmalljavatotalhitsMovedtotrash:hdfs://localhost:8020/w3c/out12/12

java - 启动namenode失败 : java.net.BindException: Address already in use

我正在尝试启动名称节点,但它一直显示:启动名称节点失败。java.net.BindException:地址已在使用中;。netstat-a|grep9000返回tcp00:9000*:LISTENtcp600[::]:9000[::]:*LISTEN这是正常的还是我需要终止其中一个进程?名称节点在安装后启动并运行,但在我运行WordCount作业后突然停止工作。我试过多次重启VM并格式化名称节点,但这没有帮助。hdfs-site.xml如下:dfs.replication1dfs.namenode.name.dir文件:///usr/local/hdfs/namenodedfs.dat

hadoop - 无法启动 CDH4 辅助名称节点 : Invalid URI for NameNode address

我一直在尝试设置hadoop的CDH4安装。我有12台机器,标记为hadoop01-hadoop12,名称节点、作业跟踪器和所有数据节点都已正常启动。我能够查看dfshealth.jsp并看到它找到了所有数据节点。但是,每当我尝试启动辅助名称节点时,它都会出现异常:StartingHadoopsecondarynamenode:[OK]startingsecondarynamenode,loggingto/var/log/hadoop-hdfs/hadoop-hdfs-secondarynamenode-hadoop02.dev.terapeak.com.outExceptionint

hadoop - 配置不正确 : namenode address dfs. namenode.rpc-address没有配置

当我尝试启动DataNode时出现此错误。据我所知,RPC参数仅用于HA配置,我没有设置(我认为)。2014-05-1818:05:00,589INFO[main]impl.MetricsSystemImpl(MetricsSystemImpl.java:shutdown(572))-DataNodemetricssystemshutdowncomplete.2014-05-1818:05:00,589INFO[main]datanode.DataNode(DataNode.java:shutdown(1313))-Shutdowncomplete.2014-05-1818:05:00

hadoop - dfs.namenode.servicerpc-address 或 dfs.namenode.rpc-address 未配置

我试图用一个名称节点和四个数据节点配置hadoop。我能够在一台机器上成功配置名称节点和作业跟踪器并将其启动。但是在我要配置数据节点的机器上,我做了以下操作:我将hadoop-2.0.0-cdh4.1.2.tar.gz和mr1-2.0.0-mr1-cdh4.1.2.tar.gz解压到一个文件夹并设置主从配置。在master文件中,我设置了配置为名称节点的机器的IP地址。在从属机器中,我设置了我解压缩tar球的机器的IP地址。当我尝试使用命令启动数据节点时hdfsdatanode我收到这个错误:java.io.IOException:Incorrectconfiguration:name