草庐IT

test-network

全部标签

hadoop - 如何在 HDP 2.2 中安装 hadoop-examples* 和 hadoop-test* jar?

如何在HortonworksDataPlatform2.2上安装hadoop-examples*和hadoop-test*jar?这些jar在任何服务器上都不存在。我需要安装其他软件包吗?我找到了一个reference也就是说,它们应该位于/usr/share/hadoop,但该目录在我的集群中的任何节点上都不存在。 最佳答案 对于HDP2.2,大多数内容都移到了/usr/hdp下,所以这些可能就是您要找的内容。[hdpdemo@hdp-demo-mas5hdp]$pwd/usr/hdp[hdpdemo@hdp-demo-mas5h

hadoop - org.apache.hadoop.security.AccessControlException : Permission denied: user=test-user, access=EXECUTE, inode ="system":hadoop:test-user:rwx------

以前测试用户曾经驻留在连接丢失的边缘服务器上。因此,我们重建了边缘服务器并一直在尝试启动并运行它,但我一直收到以下错误。Jobinitializationfailed:org.apache.hadoop.security.AccessControlException:org.apache.hadoop.security.AccessControlException:Permissiondenied:user=test-user,access=EXECUTE,inode="system":hadoop:test-user:rwx------atsun.reflect.GeneratedC

hadoop - 关于 hadoop fs test 命令输出

我在命令下运行,尝试使用文件名存在或文件名不存在,但它们都没有来自控制台的任何输出。我希望如果文件存在,该命令应该返回零?http://hadoop.apache.org/docs/current/hadoop-project-dist/hadoop-common/FileSystemShell.html#testhadoopfs-test-efilename 最佳答案 我认为这意味着命令的返回码是0。你可以检查hadoopfs-test-efilenameecho$? 关于hadoop

networking - 分析 Hadoop 网络带宽消耗的工具

我想分析集群中的Hadoop1.0.3带宽消耗。我可以使用哪些工具来分析与所有hadoop组件相关的所有进程所使用的节点之间的带宽消耗:hdfs、jobtrackers、tasktrackers、datanode、namenode、heartbeats、datatransfer...还想将带宽消耗与进程相关联。主要问题是它的进程没有使用固定端口。如果可能,使用特定的端口范围或接口(interface)/子接口(interface)是否可行? 最佳答案 当Ganglia监控在您的集群中激活时,它会提供大量指标(尽管我不确定它是否提供带

unit-testing - 如何对 Hadoop Writable 进行单元测试

我自己实现了WritableComparable,但是我找不到适合单元测试write和readFields方法的好东西。有什么想法吗? 最佳答案 也许您可以找到更简单的方法来测试您的可写对象,但手动执行序列化/反序列化也可以。例如:MyUtils.java:...importorg.apache.commons.io.IOUtils;...publicstaticbyte[]serialize(Writablewritable)throwsIOException{ByteArrayOutputStreamout=newByteArr

unit-testing - 如何在 oozie 工作流中运行 hadoop 示例 jar?

这让我发疯了——我觉得自己像个白痴,想弄清楚如何做到这一点!我正在构建一个使用Oozie客户端库来运行工作流的应用程序。真的很简单,我想为我的代码构建一些测试,这样我就可以检查我是否在做正确的事情实际代码-感谢oozie客户端库-非常简单。我已经安装了Hadoop并且可以运行标准的wordcount提供的示例,没有任何问题,但是我不知道如何通过Oozie运行东西,它让我抓狂。所以我想我会作弊并问一些知道的人(蠕变蠕变)。我如何转换:bin/hadoopjarhadoop*examples*.jarwordcountinput/somedataoutputOozie工作流?我假设它是一个

hadoop - 使用 hdfs dfs -test 查看目录是否存在

在hadoop文档中:testUsage:hadoopfs-test-[defsz]URIOptions:-d:fthepathisadirectory,return0.-e:ifthepathexists,return0.-f:ifthepathisafile,return0.-s:ifthepathisnotempty,return0.-z:ifthefileiszerolength,return0.Example:hadoopfs-test-efilename如果hdfs目录不存在,我想做点什么。-test选项中的每个参数都返回0。如果目录不存在,我该如何输出?drwx-----

testing - Oozie:在本地测试工作流程

基于OoozieXML的工作流定义容易出错,并且在运行时难以调试。此外,在生产环境中运行它们存在一定风险。1)是否有一种简单的方法来测试基于oozie的工作流/应用程序;通过嵌入式服务器或其他模拟环境?2)关于oozie开发是否有任何完善的IDE/TDD习语? 最佳答案 MiniOozie可能会有所帮助。还使用-dryrun允许打印1个具体化的已解析xml并进行语法检查-http://oozie.apache.org/docs/3.3.2/DG_CommandLineTool.html#Dryrun_of_Coordinator_J

networking - 如何为 Hadoop 生态系统配置主机文件

这个问题可能看起来很明显,但由于hadoop集群上主机文件的错误配置,我遇到过很多次。任何人都可以描述如何为hadoop和类似环境使用(如cloudera)设置主机文件和其他相关网络配置。特别是当我必须同时添加主机名和FQDN时更新这是主机名cdh4hdm中的一台机器的主机文件,具有hadoopMaster的作用127.0.0.1   cdh4hdmlocalhost#127.0.1.1   cdh4hdm#ThefollowinglinesaredesirableforIPv6capablehosts172.26.43.40  cdh4hdm.imp.co.in      kdc11

networking - Hadoop 节点在一段时间后死亡(崩溃)

我有一个包含16个(ubuntu12.04服务器)节点(1个主节点和15个从节点)的hadoop集群。它们通过私有(private)网络连接,master也有一个公共(public)IP(它属于两个网络)。当我运行小任务时,即小输入和小处理时间,一切正常。然而,当我运行更大的任务时,即输入数据为7-8GB时,我的从属节点开始一个接一个地死掉。从网络用户界面(http://master:50070/dfsnodelist.jsp?whatNodes=LIVE)我看到最后一个联系人开始增加,从我的集群提供商的网络用户界面,我看到节点崩溃了。这是一个节点的屏幕截图(我无法向上滚动):另一台机