network-tools_草庐IT

hadoop - (Sqoop-import) 错误 tool.ImportTool : Encountered IOException running import job: java. io.IOException:Hive 以状态 9 退出

当我输入命令时:./sqoop-import--connectjdbc:mysql://localhost/sqoop2-tablesqeep2-m1-hive-import当执行这条命令时:hadoop@dewi:/opt/sqoop/bin$./sqoop-import--connectjdbc:mysql://localhost/sqoop2-tablesqeep2-m1-hive-import12/06/2010:00:44INFOtool.BaseSqoopTool:UsingHive-specificdelimitersforoutput.Youcanoverride12/

networking - 分析 Hadoop 网络带宽消耗的工具

我想分析集群中的Hadoop1.0.3带宽消耗。我可以使用哪些工具来分析与所有hadoop组件相关的所有进程所使用的节点之间的带宽消耗:hdfs、jobtrackers、tasktrackers、datanode、namenode、heartbeats、datatransfer...还想将带宽消耗与进程相关联。主要问题是它的进程没有使用固定端口。如果可能，使用特定的端口范围或接口(interface)/子接口(interface)是否可行？最佳答案当Ganglia监控在您的集群中激活时，它会提供大量指标(尽管我不确定它是否提供带

networking Hadoop section noreferrer noopener bandwidth network-monitoring

java - Hadoop : Tools for visualizing key value data and files for development

是否有任何简单、易于启动的java工具来可视化来自mapreduce作业目录的键/值数据？具体来说，我想浏览一个20个作业的mapreduceworkflow，点击单个文件并查看数据，甚至可能看到文件大小的直方图。这里有一些注意事项，例如-一些文件有序列化数据(不仅仅是文本)显然，这个系统在“云规模”上使用可能会很愚蠢，而不是一个开发工具。尽管如此，这样的工具对于开发和本地调试大型连接的m/r管道很有用。这是出于开发目的(我不是试图在真实集群中可视化分布式键/值hadoop数据)。最佳答案检查KarmaSphereStudioM

development visualizing section strong the java hadoop key-value file-browser

java - Maven 从源代码安装 Hadoop，寻找 tools.jar 的错误路径

我正在尝试使用“mvncleaninstall”构建hadoop-2.4.0-src。大约一半成功完成，但随后HDFSprojetc失败并显示:线程“主”java.lang.AssertionError中的异常:缺少tools.jar位于:/Library/Java/JavaVirtualMachines/jdk1.7.0_55.jdk/Contents/Home/Classes/classes.jar。表达式:file.exists()....../Home/Classes/不存在，tools.jar在......./Home/lib.我的$JAVA_HOME环境变量肯定设置正确，并

Hadoop Maven code lrwxr-xr-x wheel java

hadoop - 亚马逊弹性 map 减少 : Listing job flows in command line tools Issue?

我是Amazon网络服务的新手，我正在尝试使用命令行界面工具在Amazonelasticmapreduce作业上运行作业流。我按照来自aws的开发人员指南的亚马逊开发人员指南中的步骤进行操作。但事情对我来说并不清楚。如果我执行命令./elastic-mapreduce--list列出作业流程。显示以下错误。/home/pdurai/Applications/elastic-mapreduce-cli/amazon/coral/httpdestinationhandler.rb:23:warning:elsewithoutrescueisuseless/usr/local/rbenv/v

Listing command require custom_require elastic-mapreduce-cli hadoop amazon-web-services cloudera elastic-map-reduce ganglia

networking - 如何为 Hadoop 生态系统配置主机文件

这个问题可能看起来很明显，但由于hadoop集群上主机文件的错误配置，我遇到过很多次。任何人都可以描述如何为hadoop和类似环境使用(如cloudera)设置主机文件和其他相关网络配置。特别是当我必须同时添加主机名和FQDN时更新这是主机名cdh4hdm中的一台机器的主机文件，具有hadoopMaster的作用127.0.0.1 cdh4hdmlocalhost#127.0.1.1 cdh4hdm#ThefollowinglinesaredesirableforIPv6capablehosts172.26.43.40 cdh4hdm.imp.co.in kdc11

何为 networking cdh4 cdh strong hadoop cloudera

networking - Hadoop 节点在一段时间后死亡(崩溃)

我有一个包含16个(ubuntu12.04服务器)节点(1个主节点和15个从节点)的hadoop集群。它们通过私有(private)网络连接，master也有一个公共(public)IP(它属于两个网络)。当我运行小任务时，即小输入和小处理时间，一切正常。然而，当我运行更大的任务时，即输入数据为7-8GB时，我的从属节点开始一个接一个地死掉。从网络用户界面(http://master:50070/dfsnodelist.jsp?whatNodes=LIVE)我看到最后一个联系人开始增加，从我的集群提供商的网络用户界面，我看到节点崩溃了。这是一个节点的屏幕截图(我无法向上滚动):另一台机

networking Hadoop apache datanode ubuntu cluster-computing

hadoop - 使用 avro-tools 连接 Avro 文件

我试图将avro文件合并成一个大文件，问题是concat命令不接受通配符hadoopjaravro-tools.jarconcat/input/part*/output/bigfile.avro我得到:Exceptioninthread"main"java.io.FileNotFoundException:Filedoesnotexist:/input/part*我尝试使用""和''但没有机会。最佳答案我很快检查了Avro的源代码(1.7.7)，似乎concat不支持glob模式(基本上，除了最后一个参数之外，它们对每个参数调用

avro-tools hadoop code section avro hdfs

java - 如何在 Windows 上获取适用于 OpenJDK 11 的 tools.jar？

背景:我正尝试使用找到的说明为Windows构建Hadoophere.我有OpenJDK11并在运行mvnpackage时遇到了以下问题:无法解析项目org.apache.hadoop:hadoop-annotations:jar:2.5.0-SNAPSHOT的依赖项:无法在指定路径C:处找到Artifactjdk.tools:jdk.tools:jar:1.6\ProgramFiles\Java\jdk-11.0.1\..\lib\tools.jar我意识到OpenJDK11的Windows构建中不存在tools.jar。我是否也必须从源代码构建它？我如何获取适用于OpenJDK11

何在 Windows section jar tools java maven hadoop java-11 tools.jar

networking - Hadoop HDFS - 无法连接到主服务器上的端口

我已经设置了一个小型Hadoop集群用于测试。NameNode(1台机器)、SecondaryNameNode(1台)和所有DataNodes(3台)的设置非常顺利。这些机器被命名为“master”、“secondary”和“data01”、“data02”和“data03”。所有DNS均已正确设置，无密码SSH已从主/辅助设备配置到所有机器并返回。我使用bin/hadoopnamenode-format格式化集群，然后使用bin/start-all.sh启动所有服务。使用jps检查所有节点上的所有进程是否已启动并正在运行。我的基本配置文件如下所示:fs.default.namehdf

networking Hadoop code localhost port hdfs