草庐IT

client_graph

全部标签

java - AmazonS3Client 在 hadoop(oozie) 中通过代理

我正在尝试通过oozie运行java代码。该代码是为非代理环境编写的,但我试图在需要代理服务器设置的环境中实现它。这是我在运行作业时遇到的错误。2015-05-1809:22:26,929WARNcom.amazonaws.http.AmazonHttpClient:UnabletoexecuteHTTPrequest:connecttimedoutjava.net.SocketTimeoutException:connecttimedout现在这是预期的行为,因为我需要通过代理传递那个,但问题是我没有看到这个连接到代理。所有人都试图直接连接到互联网,但被防火墙阻止了。我已经使用/et

java - 获取 E0902 : Exception occured:[Server IPC version 9 cannot communicate with client version 4]

我的hadoop版本是2.7.1,我的oozie版本是3.3.2。我已经创建了oozie.war文件成功。但是,当我尝试使用以下命令在hdfs中创建共享库时,oozie-setup.shsharelibcreate-fshdfs://training-21:54310我得到以下异常,Stacktracefortheerrorwas(fordebugpurposes):--------------------------------------org.apache.oozie.service.HadoopAccessorException:E0902:Exceptionoccured:[

graph - 将多个顺序 HBase 查询的结果传递给 Mapreduce 作业

我有一个HBase数据库,它存储有向图的邻接表,每个方向的边存储在一对列族中,其中每一行表示一个顶点。我正在编写一个mapreduce作业,它将所有节点作为其输入,这些节点也具有从相同顶点指向的边,因为具有指向其他顶点(指定为查询的主题)的边。这有点难以解释,但在下图中,当查询顶点“A”时,作为输入的节点集将是{A,B,C},因为它们都具有来自顶点的边'1':为了在HBase中执行此查询,我首先在产生{1}的反向边列族中查找边为“A”的顶点,然后,对于该集合中的每个元素,从该元素中查找边为“A”的顶点该集合的前向边缘列族。这应该会产生一组键值对:{1:{A,B,C}}。现在,我想获取这

hadoop - HBase错误: Server IPC version 8 cannot communicate with client version 4

我使用的是hbase-0.94.9,我试着按照HBase在线书籍的介绍,但是我得到了错误:org.apache.hadoop.hbase.master.HMasterCommandLine:Failedtostartmasterjava.net.ConnectException:Calltolocalhost/127.0.0.1:8020failedonconnectionexception:java.net.ConnectException然后我在网上发现我必须先设置Hadoop,我在Hadoop2.0.5-alpha中使用了start-dfs.sh但是现在我得到这个错误,当我尝试运

java - 在 yarn "org.apache.hadoop.ipc.Client - Retrying connect to server: tasktracker3/10.201.2.169:50000"上运行时在 apache Pig 中出现错误

我正在运行ApachePig0.11.2和Hadoop2.2.0。我在Pig中运行的大多数简单作业都运行良好。但是,每当我尝试在大型数据集上使用GROUPBY或LIMIT运算符时,我都会收到以下连接错误:2013-12-1811:21:28,400[main]INFOorg.apache.hadoop.ipc.Client-Retryingconnecttoserver:tasktracker2/10.201.2.145:54957.Alreadytried0time(s);retrypolicyisRetryUpToMaximumCountWithFixedSleep(maxRetr

java - 线程 "main"org.apache.hadoop.ipc.RemoteException : Server IPC version 9 cannot communicate with client version 4. 中的异常如何解决?

我在NetBeansIDE8.0.2中使用hadoop2.7.0和javaoraclejdk1.7.0_79。当我尝试使用Java文件与Hadoop通信时,出现以下错误。是否涉及任何依赖性问题?或者我该如何解决这个错误?我看过相关问题的帖子,但没有一个有助于清楚地传达答案。所以,请帮帮我。谢谢!Exceptioninthread"main"org.apache.hadoop.ipc.RemoteException:ServerIPCversion9cannotcommunicatewithclientversion4atorg.apache.hadoop.ipc.Client.call

graph - Hadoop MapReduce 在图中实现最短路径,而不仅仅是距离

我一直在寻找“最短路径搜索算法的MapReduce实现”。但是,我能找到的所有实例都“计算了从节点x到y的最短距离”,但实际上没有一个实例输出“像x-a-b-c-y这样的实际最短路径”。至于我想要实现的是我有数百个节点的图形,我需要对各个节点之间的最短路径执行频繁的模式分析。这是我正在进行的研究项目。如果有人能指出一些实现(如果存在的话)或给出一些关于如何破解现有SSSP实现以生成路径和距离. 最佳答案 基本上这些实现与某种消息传递一起工作。因此消息在map和reduce阶段之间被发送到HDFS。在reducer中,它们按距离分组和

hadoop - kinit : Client's credentials have been revoked while getting initial credentials

我的hdp集群配置了带有AD的kerberos。所有HDP服务帐户都生成了主体和key表,包括spark。我知道服务帐户没有密码并设置为未过期。现在在执行kinit-ktspark.keytab-pspark-PRINCIPAL时出现以下错误(请参阅标题)。我在麻省理工学院的网站上读到,这是由于多次登录尝试失败或KDC中默认策略中设置的帐户过期而发生的。可以使用kadmin命令解锁帐户,例如kadmin:modprincispark/principal但我已与AD管理员进行交叉检查。他说我们在使用AD时不使用kdc服务器执行kadmin命令,但说使用ADUI检查时spark帐户处于解锁

maven - Flink 错误 - org.apache.hadoop.ipc.RemoteException : Server IPC version 9 cannot communicate with client version 4

我正在尝试使用来自HDFS的文件运行flink作业。我创建了一个数据集如下-DataSource>visits=env.readHadoopFile(newTextInputFormat(),LongWritable.class,Text.class,Config.pathToVisits());我使用的是flink的最新版本——0.9.0-milestone-1-hadoop1(我也尝试过0.9.0-milestone-1)而我的Hadoop版本是2.6.0但是,当我尝试执行作业时出现以下异常。我搜索了类似的问题,它与客户端和hdfs之间的版本不兼容有关。Exceptioninthr

hadoop - IllegalArgumentException 必须指定 bucketName 参数。 com.amazonaws.services.s3.AmazonS3Client.rejectNull

使用(hfs-textline)在AWS-EMR集群上运行Clojurejar并获取:IllegalArgumentExceptionThebucketNameparametermustbespecified.com.amazonaws.services.s3.AmazonS3Client.rejectNull`. 最佳答案 在我的例子中,它确实是关于bucketname的。我输错了s3:///mkay4242(3个斜线)而不是s3://mkay4242。 关于hadoop-Illega