我在Hadoop版本0.20.203上使用ApacheGiraph版本1.0。它执行ConnectedComponentsVertex和SimpleShortetPathsVertex,apachegiraph的例子,作业成功,但存在问题。作业完成后不会释放内存。如系统监视器所示,为该作业创建的java进程仍然有效。我不明白为什么会出现这个问题。是Giraph的错误还是我做错了什么???我正在使用Ubuntu11.10和java1.6。任何帮助将不胜感激。谢谢 最佳答案 是的,我认为这是一个错误(请参阅我在用户列表上的问题:http
如果我有Spark集群和Cassandra但没有Hadoop集群,我可以使用Giraph吗?目前,我正在使用GraphX,并想改用Giraph。考虑到我有Spark集群并且正在使用Cassandra,这是否可能? 最佳答案 几年前我对Giraph的使用经验有限,而且我从未尝试过在Hadoop集群之外使用它。但看起来你想要的东西即使不一定容易,至少在技术上是可行的。这code是使用ApacheGiraph进行实用图形分析的姊妹篇。如您所见,例如,它在DoubleWritable和Text的类路径中需要Hadoop,但它对Hadoop集
我是Hadoop/Giraph和Java的新手。作为任务的一部分,我在其上下载了ClouderaQuickstartVM和Giraph。我正在使用这本书,名为“使用ApacheGiraph进行实用图形分析;作者:Shaposhnik、Roman、Martella、Claudio、Logothetis、Dionysios”,我尝试从中运行第111页上的第一个示例(TwitterFollowershipGraph)。尝试在集群2.6.0-mr1-cdh5.12.0上使用hadoop版本运行更改后的pom.xml文件时,请发现以下错误`[cloudera@quickstartfirst]$m
我的PC上有一个正常工作的多节点giraph集群。我从Giraph执行了SimpleShortestPathExample并且执行得很好。此算法使用此文件(tiny_graph.txt)运行:[0,0,[[1,1],[3,3]]][1,0,[[0,1],[2,2],[3,1]]][2,0,[[1,2],[4,4]]][3,0,[[0,3],[1,1],[4,4]]][4,0,[[3,4],[2,4]]]此文件具有以下输入格式:[source_id,source_value,[[dest_id,edge_value],...]]现在,我尝试在同一个集群中执行同一个算法,但输入文件与原始文
最近我正在运行一些基准测试来了解Giraph中的故障转移机制。其实我很好奇;当工作中的一个worker变慢时,其他worker将等待它。后来在GiraphJob.java中发现了这样的东西://Speculativeexecutiondoesn'tmakesenseforGiraphgiraphConfiguration.setBoolean("mapred.map.tasks.speculative.execution",false);有谁知道为什么Giraph中没有启用推测执行?谢谢 最佳答案 首先让我们回顾一下什么是推测执行。
我正在尝试构建Giraph。我有以下内容:java版本“1.7.0_25”、ApacheMaven3.0.4、Hadoop1.0.4。我正在按照此页面中的说明进行操作:https://cwiki.apache.org/confluence/display/GIRAPH/Quick+Start+Guide当我运行:mvncompile时,出现以下错误:[INFO]Scanningforprojects...[INFO]------------------------------------------------------------------------[INFO]ReactorB
有人在EMR上尝试过ApacheGiraph吗?在我看来,在EMR上运行的唯一要求是将适当的引导脚本添加到作业流程配置中。然后我应该只需要使用标准的自定义JAR启动步骤来启动GiraphRunner,并为我的Giraph程序提供适当的参数。任何文档/教程,或者如果您可以分享您在EMR上使用Giraph的经验,我们将不胜感激。 最佳答案 是的,我定期在EMR上运行Giraph作业,但我不使用“作业流程”,我手动登录到主节点并将其用作普通的Hadoop集群(我只是使用hadoopjar提交作业命令)。你是对的,你需要添加引导脚本来运行Z
我正在使用Giraph开发算法。我在Hadoop1.2.1上使用1.0.0版。我是开发Giraph的新手,所以请保持温和;)我的自定义作业分为三个包:io:包含输入和输出格式类layout:包含Vertex类、Aggregator类和MasterCompute类。run:包含工具实现类。我使用构建的giraph-corejar作为引用在Eclipse中对其进行编程,然后将其导出到另一个名为“customJob.jar”的jar中。这是我在Hadoop中启动它的方式:hadoopjar/opt/hadoop/lib/customJob.jarlayout.customrVertex-vi
我正在尝试使用最新的Giraph代码和Hadoop2.5.2运行SimpleShortestPathsComputation示例。我的命令行如下所示:hadoopjar/home/prhodes/giraph/giraph-examples/target/giraph-examples-1.2.0-SNAPSHOT-for-hadoop-2.5.2-jar-with-dependencies.jarorg.apache.giraph.GiraphRunnerorg.apache.giraph.examples.SimpleShortestPathsComputation-viforg.
我使用PageRankBenchmark示例运行Giraph1.0.0和hadoop2.2.0here.突然我得到这个错误结果:Exceptioninthread"main"java.lang.IllegalArgumentException:checkLocalJobRunnerConfiguration:WhenusingLocalJobRunner,musthaveonlyoneworkersinceonly1taskatatime!atorg.apache.giraph.job.GiraphJob.checkLocalJobRunnerConfiguration(GiraphJ