草庐IT

NTriplesMapper

全部标签

java - Hadoop NTriplesMapper (apache.jena) 无法正常工作,映射输入记录=0

我正在研究PageRank算法的实现,该算法使用Hadoop、MapReduce和RDF三元组作为源。到目前为止,代码非常简单,主类中有一个作业,然后是映射器和缩减器。输入文件是一个.nt文件,里面全是rdf三元组,比如:.映射器应该将这些三元组映射到主题、对象对中。对于给定的rdf它将是:Reducer应该将这些对分组到包含主题、基本PageRank(1)和对象列表的行中。例如:1.0,我在Windows上使用hadoop2.3.0。显然它配置正确,因为这样的WordCount示例可以在其上运行。(编辑)也在hadoop2.6.0上的linux下尝试过,没有更好的效果,结果是一样的。