graph_tool

hadoop - Spark : Export graph data to anything (Hive, 文本等)

我有一个以这种方式创建的星图valgraph=Graph(vertices,edges,defaultArticle).cache我的顶点是RDD[(Long,(String,Option[String],List[String],Option[String])]我的边是RDD[Edge[长]]如何将此图形/边/顶点保存到Hive/文本文件/其他任何内容，以及如何读回它？我查看了SparkSQL文档和Spark核心文档，但我仍然没有成功。如果我执行saveAsTextFile()，那么当我读回它时，它是一个RDD[String]，这不是我需要的....编辑:Daniel提供了另存为对象

hadoop - 使用命令行 parquet-tools 查看 parquet 中的模式

我正在尝试运行parquet-tools命令仅查看我的Parquet文件的文件模式。我目前正在运行:$parquet-toolsmeta/tmp/my-file.parquet但这会显示文件架构加上数百个行组。我不想看到行组，只想看到文件架构。最佳答案尝试parquet-toolsschema/tmp/my-file.parquet 关于hadoop-使用命令行parquet-tools查看parquet中的模式，我们在StackOverflow上找到一个类似的问题：

parquet parquet-tools section hadoop

java - Hadoop 上的错误 : Could not find or load main class org. apache.hadoop.hdfs.tools.GetConf

Error:Couldnotfindorloadmainclassorg.apache.hadoop.hdfs.tools.GetConf在[]上启动名称节点localhost:启动namenode，记录到/usr/local/hadoop/hadoop-2.6.0/logs/hadoop-ingreens-namenode-ingreens-desktop.outlocalhost:启动datanode，记录到/usr/local/hadoop/hadoop-2.6.0/logs/hadoop-ingreens-datanode-ingreens-desktop.out错误:无法找到

GetConf Hadoop HADOOP_HOME java apache

hadoop - 在cloudera中安装apache hadoop-tools

我有cloudera5.14开发环境。我想在cloudera发行版中安装apachehadoop-tools(link)。具体来说，我需要hadoop-resourceestimator(link)。没有可用的文档说明如何安装相同的.我们将不胜感激任何潜在客户。最佳答案 AFAIKcdh5.14.x基于旧的hadoop版本2.6.0，它没有resourceestimator工具。它可用但在CDH6中不受支持(“不支持”与“不可用”不同)。你可以在CDH6.x发行版中找到resourceestimator，-rw-r--r--1ro

中安 hadoop section resourceestimator cloudera-cdh hadoop-plugins

graph - 将多个顺序 HBase 查询的结果传递给 Mapreduce 作业

我有一个HBase数据库，它存储有向图的邻接表，每个方向的边存储在一对列族中，其中每一行表示一个顶点。我正在编写一个mapreduce作业，它将所有节点作为其输入，这些节点也具有从相同顶点指向的边，因为具有指向其他顶点(指定为查询的主题)的边。这有点难以解释，但在下图中，当查询顶点“A”时，作为输入的节点集将是{A，B，C}，因为它们都具有来自顶点的边'1':为了在HBase中执行此查询，我首先在产生{1}的反向边列族中查找边为“A”的顶点，然后，对于该集合中的每个元素，从该元素中查找边为“A”的顶点该集合的前向边缘列族。这应该会产生一组键值对:{1:{A,B,C}}。现在，我想获取这

Mapreduce 传递射器 section 的 graph hadoop hbase

hadoop - (Sqoop-import) 错误 tool.ImportTool : Encountered IOException running import job: java. io.IOException:Hive 以状态 9 退出

当我输入命令时:./sqoop-import--connectjdbc:mysql://localhost/sqoop2-tablesqeep2-m1-hive-import当执行这条命令时:hadoop@dewi:/opt/sqoop/bin$./sqoop-import--connectjdbc:mysql://localhost/sqoop2-tablesqeep2-m1-hive-import12/06/2010:00:44INFOtool.BaseSqoopTool:UsingHive-specificdelimitersforoutput.Youcanoverride12/

IOException import INFO JobClient mapred hadoop hive sqoop

java - Hadoop : Tools for visualizing key value data and files for development

是否有任何简单、易于启动的java工具来可视化来自mapreduce作业目录的键/值数据？具体来说，我想浏览一个20个作业的mapreduceworkflow，点击单个文件并查看数据，甚至可能看到文件大小的直方图。这里有一些注意事项，例如-一些文件有序列化数据(不仅仅是文本)显然，这个系统在“云规模”上使用可能会很愚蠢，而不是一个开发工具。尽管如此，这样的工具对于开发和本地调试大型连接的m/r管道很有用。这是出于开发目的(我不是试图在真实集群中可视化分布式键/值hadoop数据)。最佳答案检查KarmaSphereStudioM

development visualizing section strong the java hadoop key-value file-browser

graph - Hadoop MapReduce 在图中实现最短路径，而不仅仅是距离

我一直在寻找“最短路径搜索算法的MapReduce实现”。但是，我能找到的所有实例都“计算了从节点x到y的最短距离”，但实际上没有一个实例输出“像x-a-b-c-y这样的实际最短路径”。至于我想要实现的是我有数百个节点的图形，我需要对各个节点之间的最短路径执行频繁的模式分析。这是我正在进行的研究项目。如果有人能指出一些实现(如果存在的话)或给出一些关于如何破解现有SSSP实现以生成路径和距离. 最佳答案基本上这些实现与某种消息传递一起工作。因此消息在map和reduce阶段之间被发送到HDFS。在reducer中，它们按距离分组和

图中 MapReduce section 的 code graph hadoop shortest-path

java - Maven 从源代码安装 Hadoop，寻找 tools.jar 的错误路径

我正在尝试使用“mvncleaninstall”构建hadoop-2.4.0-src。大约一半成功完成，但随后HDFSprojetc失败并显示:线程“主”java.lang.AssertionError中的异常:缺少tools.jar位于:/Library/Java/JavaVirtualMachines/jdk1.7.0_55.jdk/Contents/Home/Classes/classes.jar。表达式:file.exists()....../Home/Classes/不存在，tools.jar在......./Home/lib.我的$JAVA_HOME环境变量肯定设置正确，并

Hadoop Maven code lrwxr-xr-x wheel java

hadoop - 亚马逊弹性 map 减少 : Listing job flows in command line tools Issue?

我是Amazon网络服务的新手，我正在尝试使用命令行界面工具在Amazonelasticmapreduce作业上运行作业流。我按照来自aws的开发人员指南的亚马逊开发人员指南中的步骤进行操作。但事情对我来说并不清楚。如果我执行命令./elastic-mapreduce--list列出作业流程。显示以下错误。/home/pdurai/Applications/elastic-mapreduce-cli/amazon/coral/httpdestinationhandler.rb:23:warning:elsewithoutrescueisuseless/usr/local/rbenv/v

Listing command require custom_require elastic-mapreduce-cli hadoop amazon-web-services cloudera elastic-map-reduce ganglia

98 99 100101102 103 104