草庐IT

giraph 作业完成后,内存不会被释放

我在Hadoop版本0.20.203上使用ApacheGiraph版本1.0。它执行ConnectedComponentsVertex和SimpleShortetPathsVertex,apachegiraph的例子,作业成功,但存在问题。作业完成后不会释放内存。如系统监视器所示,为该作业创建的java进程仍然有效。我不明白为什么会出现这个问题。是Giraph的错误还是我做错了什么???我正在使用Ubuntu11.10和java1.6。任何帮助将不胜感激。谢谢 最佳答案 是的,我认为这是一个错误(请参阅我在用户列表上的问题:http

hadoop - Giraph、Hadoop、Spark 和 Cassandra

如果我有Spark集群和Cassandra但没有Hadoop集群,我可以使用Giraph吗?目前,我正在使用GraphX,并想改用Giraph。考虑到我有Spark集群并且正在使用Cassandra,这是否可能? 最佳答案 几年前我对Giraph的使用经验有限,而且我从未尝试过在Hadoop集群之外使用它。但看起来你想要的东西即使不一定容易,至少在技术上是可行的。这code是使用ApacheGiraph进行实用图形分析的姊妹篇。如您所见,例如,它在DoubleWritable和Text的类路径中需要Hadoop,但它对Hadoop集

maven - Cloudera VM 上的 Apache Giraph - org.apache.hadoop 的 POM :hadoop-core:jar:2. 6.0 缺失,无依赖信息

我是Hadoop/Giraph和Java的新手。作为任务的一部分,我在其上下载了ClouderaQuickstartVM和Giraph。我正在使用这本书,名为“使用ApacheGiraph进行实用图形分析;作者:Shaposhnik、Roman、Martella、Claudio、Logothetis、Dionysios”,我尝试从中运行第111页上的第一个示例(TwitterFollowershipGraph)。尝试在集群2.6.0-mr1-cdh5.12.0上使用hadoop版本运行更改后的pom.xml文件时,请发现以下错误`[cloudera@quickstartfirst]$m

hadoop - Giraph best 的顶点输入格式,用于 ID 类型为 String 的输入文件

我的PC上有一个正常工作的多节点giraph集群。我从Giraph执行了SimpleShortestPathExample并且执行得很好。此算法使用此文件(tiny_graph.txt)运行:[0,0,[[1,1],[3,3]]][1,0,[[0,1],[2,2],[3,1]]][2,0,[[1,2],[4,4]]][3,0,[[0,3],[1,1],[4,4]]][4,0,[[3,4],[2,4]]]此文件具有以下输入格式:[source_id,source_value,[[dest_id,edge_value],...]]现在,我尝试在同一个集群中执行同一个算法,但输入文件与原始文

java - 为什么推测执行对 Giraph 没有意义?

最近我正在运行一些基准测试来了解Giraph中的故障转移机制。其实我很好奇;当工作中的一个worker变慢时,其他worker将等待它。后来在GiraphJob.java中发现了这样的东西://Speculativeexecutiondoesn'tmakesenseforGiraphgiraphConfiguration.setBoolean("mapred.map.tasks.speculative.execution",false);有谁知道为什么Giraph中没有启用推测执行?谢谢 最佳答案 首先让我们回顾一下什么是推测执行。

git - 构建 Giraph 时出现编译错误

我正在尝试构建Giraph。我有以下内容:java版本“1.7.0_25”、ApacheMaven3.0.4、Hadoop1.0.4。我正在按照此页面中的说明进行操作:https://cwiki.apache.org/confluence/display/GIRAPH/Quick+Start+Guide当我运行:mvncompile时,出现以下错误:[INFO]Scanningforprojects...[INFO]------------------------------------------------------------------------[INFO]ReactorB

hadoop - EMR 上的 Apache Giraph

有人在EMR上尝试过ApacheGiraph吗?在我看来,在EMR上运行的唯一要求是将适当的引导脚本添加到作业流程配置中。然后我应该只需要使用标准的自定义JAR启动步骤来启动GiraphRunner,并为我的Giraph程序提供适当的参数。任何文档/教程,或者如果您可以分享您在EMR上使用Giraph的经验,我们将不胜感激。 最佳答案 是的,我定期在EMR上运行Giraph作业,但我不使用“作业流程”,我手动登录到主节点并将其用作普通的Hadoop集群(我只是使用hadoopjar提交作业命令)。你是对的,你需要添加引导脚本来运行Z

java - Giraph:自定义作业上未找到类异常

我正在使用Giraph开发算法。我在Hadoop1.2.1上使用1.0.0版。我是开发Giraph的新手,所以请保持温和;)我的自定义作业分为三个包:io:包含输入和输出格式类layout:包含Vertex类、Aggregator类和MasterCompute类。run:包含工具实现类。我使用构建的giraph-corejar作为引用在Eclipse中对其进行编程,然后将其导出到另一个名为“customJob.jar”的jar中。这是我在Hadoop中启动它的方式:hadoopjar/opt/hadoop/lib/customJob.jarlayout.customrVertex-vi

java - Giraph 的工作永无止境

我正在尝试使用最新的Giraph代码和Hadoop2.5.2运行SimpleShortestPathsComputation示例。我的命令行如下所示:hadoopjar/home/prhodes/giraph/giraph-examples/target/giraph-examples-1.2.0-SNAPSHOT-for-hadoop-2.5.2-jar-with-dependencies.jarorg.apache.giraph.GiraphRunnerorg.apache.giraph.examples.SimpleShortestPathsComputation-viforg.

hadoop - Apache Giraph - 无法在分离主/工作模式下运行,因为一次只有 1 个任务

我使用PageRankBenchmark示例运行Giraph1.0.0和hadoop2.2.0here.突然我得到这个错误结果:Exceptioninthread"main"java.lang.IllegalArgumentException:checkLocalJobRunnerConfiguration:WhenusingLocalJobRunner,musthaveonlyoneworkersinceonly1taskatatime!atorg.apache.giraph.job.GiraphJob.checkLocalJobRunnerConfiguration(GiraphJ