version-numbering

java - 找不到 hive-hwi-<version>.war 文件

我无法按照描述启动HiveWeb界面here.这是hive--servicehwi的输出:ls:cannotaccess/usr/local/hive/lib/hive-hwi-*.war:Nosuchfileordirectory14/09/0913:07:59INFOhwi.HWIServer:HWIisstartingup14/09/0913:08:00FATALhwi.HWIServer:HWIWARfilenotfoundat/usr/local/hive/lib/hive-hwi-0.13.1.war看来/usr/local/hive/lib下没有.war文件!!!我应该生

python-2.7 - java.io.IOException : Broken pipe on increasing number of mappers/reducers, 很多

我在6个节点的hadoop集群上运行MapReduce作业，配置了4个映射任务和10个缩减任务。Mapper/Reducer在增加map/reduce任务数量时失败很多，如下所示，我遇到以下错误:标准错误日志java.lang.RuntimeException:PipeMapRed.waitOutputThreads():subprocessfailedwithcode143atorg.apache.hadoop.streaming.PipeMapRed.waitOutputThreads(PipeMapRed.java:362)atorg.apache.hadoop.streamin

IOException increasing hadoop java apache python-2.7 hadoop-streaming broken-pipe

maven - Flink 错误 - org.apache.hadoop.ipc.RemoteException : Server IPC version 9 cannot communicate with client version 4

我正在尝试使用来自HDFS的文件运行flink作业。我创建了一个数据集如下-DataSource>visits=env.readHadoopFile(newTextInputFormat(),LongWritable.class,Text.class,Config.pathToVisits());我使用的是flink的最新版本——0.9.0-milestone-1-hadoop1(我也尝试过0.9.0-milestone-1)而我的Hadoop版本是2.6.0但是，当我尝试执行作业时出现以下异常。我搜索了类似的问题，它与客户端和hdfs之间的版本不兼容有关。Exceptioninthr

version RemoteException section hadoop apache maven apache-flink

Hadoop MapReduce : default number of mappers

如果我不指定映射器的数量，如何确定该数量？是否有从配置文件(例如mapred-site.xml)中读取的默认设置？最佳答案在Chris上面添加的内容上添加更多内容:映射的数量通常由输入文件中的DFSblock数量决定。虽然这会导致人们调整他们的DFSblock大小来调整map的数量。map的正确并行级别似乎是大约10-100个map/节点，尽管对于非常cpu-lightmaptask，这可以达到300左右。任务设置需要一段时间，因此最好至少花一分钟时间执行map。您可以通过修改JobConf的conf.setNumMapTask

MapReduce default section map 的 hadoop

hadoop - 运行 "hadoop version"命令时，Cygwin 上 Hadoop 中的 CLASSPATH 问题

我已经使用Cygwin终端从Apache安装了Hadoop2.1beta版在Windows上。运行命令hadoopversion得到这个错误:Error:Couldnotfindorloadmainclassorg.apache.hadoop.util.VersionInfo 最佳答案您还可以将以下内容添加到您的~/.bashrcexportHADOOP_CLASSPATH=$(cygpath-pw$(hadoopclasspath)):$HADOOP_CLASSPATH这帮我解决了

hadoop amp section code cygwin

hadoop - pig : Control number of mappers

我可以通过在生成缩减器的语句中使用PARALLEL子句来控制缩减器的数量。我想控制映射器的数量。数据源已经创建，我无法减少数据源中的部件数。是否可以控制我的pig语句生成的map数量？我可以对生成的map数量设置上下限吗？控制这个是个好主意吗？我尝试使用pig.maxCombinedSplitSize、mapred.min.split.size、mapred.tasktracker.map.tasks.maximum等，但它们似乎没有帮助。有人可以帮助我了解如何控制map的数量并可能分享一个工作示例吗？最佳答案映射器的数量有一个

Control mappers 射器 section 的 hadoop apache-pig

Apache 配置单元错误 Merging of credentials not supported in this version of hadoop

我正在使用hadoop1.2.1、hbase0.94.14和hive1.0.0。我的集群中有三个数据节点，还有三个区域服务器。我必须将一些数据从hbase导入到配置单元。我已经成功配置了配置单元，但是当我运行一个命令来计数时。hive表中的行，它给出以下内容ERROR[main]:exec.Task(SessionState.java:printError(833))-JobSubmissionfailedwithexception'java.lang.RuntimeException(java.io.IOException:Mergingofcredentialsnotsupport

配置单 credentials hadoop java section apache hive hbase java-io

Java Hadoop : How can I create mappers that take as input files and give an output which is the number of lines in each file?

我是Hadoop的新手，我已经设法运行了wordCount示例:http://hadoop.apache.org/common/docs/r0.18.2/mapred_tutorial.html假设我们有一个包含3个文件的文件夹。我希望每个文件都有一个映射器，这个映射器将只计算行数并将其返回给缩减器。然后，reducer会将每个映射器的行数作为输入，并将所有3个文件中存在的总行数作为输出。所以如果我们有以下3个文件input1.txtinput2.txtinput3.txt映射器返回:mapper1->[input1.txt,3]mapper2->[input2.txt,4]mappe

mappers Hadoop 射器 section input java mapreduce distributed

hadoop - pig 到 hadoop 问题 : Server IPC version 7 cannot communicate with client version 4

我试图让pig开始但失败了:$pig2013-05-1018:03:22,972[main]INFOorg.apache.pig.Main-ApachePigversion0.11.1(r1459641)compiledMar222013,02:13:532013-05-1018:03:22,972[main]INFOorg.apache.pig.Main-Loggingerrormessagesto:/Users/barclaydunn/Environment/pig-0.11.1/pig_1368223402970.log2013-05-1018:03:23,151[main]IN

version hadoop apache java apache-pig

scala - 尝试写入 hdfs : Server IPC version 9 cannot communicate with client version 4 时出错

我正在尝试使用scala将文件写入hdfs，但我不断收到以下错误Causedby:org.apache.hadoop.ipc.RemoteException:ServerIPCversion9cannotcommunicatewithclientversion4atorg.apache.hadoop.ipc.Client.call(Client.java:1113)atorg.apache.hadoop.ipc.RPC$Invoker.invoke(RPC.java:229)atcom.sun.proxy.$Proxy1.getProtocolVersion(UnknownSource

时出 version hadoop java apache scala hdfs