草庐IT

address-operator

全部标签

hadoop - fs.http.address ip 更改后,cloudera vm hadoop Hive 失败

我正在使用ClouderaVM(cdh3u2)作为模拟的分布式文件系统。为了从Web服务器执行文件创建和写入,我更改了fs.http.address属性以指向VMIP。此功能工作正常。当HIVE执行类似mapreduce的作业时,问题就出现了SELECTCOUNT(*)FROMtmp2;我得到的信息是:hive>selectcount(*)fromtmp2;TotalMapReducejobs=1LaunchingJob1outof1Numberofreducetasksdeterminedatcompiletime:1Inordertochangetheaverageloadfora

hadoop - pig : Slow Group By operator

在对Hive和Pig进行基准测试后,我发现Pig中的GroupBy运算符比Hive的要慢得多。我想知道是否有人有过同样的经历?人们是否有任何改进此操作性能的技巧?(按照此处早期帖子的建议添加DISTINCT没有帮助。我目前正在重新运行启用LZO压缩的基准测试)。 最佳答案 看来你看错了方向。GroupBy只是以某种方式对数据进行分组,之后的操作非常重要。在Pig中尝试分析性能时,您应该牢记以下几点:1)几条语句可以合并成一个MR作业,所以不要看语句,看生成的MR作业的性能。2)性能上的巨大差异应该是有原因的。这可能是:2.1不同的输

java - Hadoop - java.net.BindException : Address already in use

我的Hadoop安装工作正常,直到我尝试更改端口号。现在,当我运行任何hadoop程序时,我得到:java.net.BindException:Problembindingtolocalhost/127.0.0.1:9010:Addressalreadyinuse9010是在conf/mapred-site.xml中定义的JobTracker的端口号。我尝试更改它,但仍然出现相同的错误。我什至尝试通过bin/stop-all.sh停止Hadoop,然后通过netstat-nl|检查端口是否被使用|grep9010什么也没找到。感谢任何解决此问题的帮助。 最佳

hadoop - 如何生成元组? pig 的运算符(operator)

我的代码如下temp=foreachrequiredDatagenerate(recordType==3?controllingCalledNum:callingPtyNum)asServiceNumber,(recordType==3?callingPtyNum:controllingCalledNum)asDestinationNumber;这里我的代码是多余的..我可以在'?'中生成元组吗?运算符并做这样的事情,我可以进一步扁平化temp=foreachrequiredDatagenerate(recordType==3?(controllingCalledNum,calling

hadoop - 错误配置 : namenode address dfs. namenode.servicerpc-address 或 dfs.namenode.rpc-address 没有配置

我正在尝试在ec2-instance上安装Hadoop-2.6.0。我下载并安装了Hadoop。我还设置了环境变量。尝试启动hdfs服务时出现以下错误。[ec2-user@ip-10-177-1-69sbin]$./start-dfs.sh配置不正确:namenode地址dfs.namenode.servicerpc-address或dfs.namenode.rpc-address没有配置。在[]上启动名称节点报错:找不到配置目录:/home/ec2-user/hadoop2.6.0/etc/hadoop报错:找不到配置目录:/home/ec2-user/hadoop2.6.0/etc

Hadoop 设置问题 : "ssh: Could not resolve hostname now.: No address associated with hostname"

我基于vmware搭建hadoop集群,使用sbin/start-dfs.sh命令,遇到ssh问题。它说,ssh:Couldnotresolvehostnamenow.:Noaddressassociatedwithhostname我已经使用vi/etc/hosts命令检查主机名和IP地址,以及vi/etc/profile命令。我保证没有错。 最佳答案 一些建议检查hdfs-site.xml中的主机名是否设置正确。如果您使用单主机设置运行,并且将名称节点主机设置为本地主机,则需要确保本地主机映射到/etc/hosts中的127.0.

xml - 为什么 YARN 上会有 mapreduce.jobtracker.address 配置?

YARN是Hadoop的二代,不再使用jobtracker守护进程,取而代之的是资源管理器。但是为什么在mapred-site.xmlhadoop2上有一个mapreduce.jobtracker.address属性? 最佳答案 你是对的。在YARN中,jobtracker不再存在。因此,作为客户端配置的一部分,您不必指定属性mapreduce.jobtracker.address。在YARN中,您应该在配置文件中将属性mapreduce.framework.name指定给yarn。您无需设置mapreduce.jotracker.

windows - 运行 MapReduce 作业时出错 : not a valid Inet address

我想尝试在Windows上使用Hadoop。我已将WindowsAzureHDInsightPreview作为单个节点安装在我的Windows7笔记本电脑上。仪表板和节点已启动并正在运行,并且HDFS正在运行。但是,当我运行MapReduce作业时,它失败并显示错误消息“不是有效的Inet地址”:c:\Hadoop\GettingStarted>powershell-ExecutionPolicyunrestricted/FrunSamples.ps1w3csmalljavatotalhitsMovedtotrash:hdfs://localhost:8020/w3c/out12/12

hadoop - 由于没有减少运算符(operator), reduce task 数设置为 0,配置单元作业没有取得进展

我在我的集​​群上使用Cloudera发行版和Hive的第13版。我遇到了一个问题,在写入日志行后作业没有取得任何进展-“由于没有reduce运算符,reduce任务数设置为0”下面是相同的日志,你能帮我看看这是什么类型的问题,因为这不是代码问题,就好像我重新运行它成功完成的相同作业一样。Logginginitializedusingconfigurationinjar:file:/opt/cloudera/parcels/CDH-5.2.1-1.cdh5.2.1.p0.12/jars/hive-common-0.13.1-cdh5.2.1.jar!/hive-log4j.proper

java - 如何修复 Hadoop 警告 : An illegal reflective access operation has occurred error on Ubuntu

我已经成功安装了Javaopenjdkversion"10.0.2"和Hadoop2.9.0。所有进程运行良好hadoopusr@amalendu:~$jps19888NameNode20388DataNode20898NodeManager20343SecondaryNameNode20539ResourceManager21118Jps但是每当我尝试执行任何命令时,如hdfsdfs-ls/都会收到此警告hadoopusr@amalendu:~$hdfsdfs-ls/WARNING:AnillegalreflectiveaccessoperationhasoccurredWARNIN