草庐IT

example_container

全部标签

hadoop - "Container is running beyond physical memory limits"

我正在从事一项工作,其中Hive查询使用R文件,分布在集群上以在每个节点上运行。像那样:ADDFILEShdfs://path/reducers/my_script.RSEThive.mapred.reduce.tasks.speculative.execution=false;SETmapred.reduce.tasks=80;INSERTOVERWRITETABLEfinal_output_tablePARTITION(partition_column1,partition_column2)SELECTselected_column1,selected_column2,partit

hadoop - "the container format for fields in a row"对文件格式意味着什么?

来自Hadoop:权威指南:TherearetwodimensionsthatgoverntablestorageinHive:therowformatandthefileformat.Therowformatdictateshowrows,andthefieldsinaparticularrow,arestored.InHiveparlance,therowformatisdefinedbyaSerDe,aportmanteauwordforaSerializer-Deserializer.Whenactingasadeserializer,whichisthecasewhenque

hadoop - 如何在 HDP 2.2 中安装 hadoop-examples* 和 hadoop-test* jar?

如何在HortonworksDataPlatform2.2上安装hadoop-examples*和hadoop-test*jar?这些jar在任何服务器上都不存在。我需要安装其他软件包吗?我找到了一个reference也就是说,它们应该位于/usr/share/hadoop,但该目录在我的集群中的任何节点上都不存在。 最佳答案 对于HDP2.2,大多数内容都移到了/usr/hdp下,所以这些可能就是您要找的内容。[hdpdemo@hdp-demo-mas5hdp]$pwd/usr/hdp[hdpdemo@hdp-demo-mas5h

Hadoop on CentOS streaming example with python - permission denied on/mapred/local/taskTracker

我已经能够使用python映射器和缩减器设置流式示例。mapred文件夹位置是/mapred/local/taskTrackerroot和mapred用户都拥有此文件夹和子文件夹的所有权然而,当我运行我的流式传输时,它会创建map但不会减少并给出以下错误无法运行程序/mapred/local/taskTracker/root/jobcache/job_201303071607_0035/attempt_201303071607_0035_m_000001_3/work/./mapper1.py权限被拒绝我注意到,虽然它为mapred/local/taskTracker及其所有子目录提供

hadoop - Spark : ClassNotFoundException when running KafkaWordCount example

我在使用以下命令在我的CDH5集群上使用kafka运行sparkstreaming时遇到问题:spark-submit--masteryarn--deploy-modeclient--classorg.apache.spark.examples.streaming.KafkaWordCount/usr/lib/spark/examples/lib/spark-examples-1.6.0-cdh5.7.0-hadoop2.6.0-cdh5.7.0.jarzk1,zk2,zk3grouptopic1请注意,真正的工作必须在客户端模式下运行,因此部署模式设置。执行上述命令会导致以下异常(驱

hadoop - 警告 org.apache.hadoop.yarn.server.nodemanager.DefaultContainerExecutor : Exit code from container container_1494943588964_0010_01_000001 is : 143

我在Ubuntu16.04上以独立模式安装了hadoop2.7.3。我已经安装了Hive2.1.1并在HQL上工作。大多数查询都会触发MR作业。当我运行触发MR作业的查询时,系统会通过终止所有进程自动注销。当我检查节点管理器的日志时,我可以看到导致问题的语句是,WARNorg.apache.hadoop.yarn.server.nodemanager.DefaultContainerExecutor:Exitcodefromcontainercontainer_1494943588964_0010_01_000001is:1432017-05-1619:48:08,263ERRORor

java - hadoop 日志中的 "complete event for unknown container id"是什么意思?

我正在尝试对集群中的多个文件运行一个简单的作业(wordcount示例),但大多数map都失败了。当我引用任务日志时,我只看到这样的错误:ERROR[RMCommunicatorAllocator]org.apache.hadoop.mapreduce.v2.app.rm.RMContainerAllocator:Containercompleteeventforunknowncontaineridcontainer_1388066512888_0001_01_000026有什么想法吗?更新:我多次检查作业,有时由于map故障而失败,有时由于减少故障而在极少数情况下成功完成。但在任何情

hadoop - HDInsight hadoop-mapreduce-examples.jar 输出在哪里?

我在HDInsight中运行示例wordcount应用程序命令成功运行,但我找不到输出。我运行的命令是hadoopjarhadoop-mapreduce-examples.jarwordcount/example/data/gutenberg/davinci.txt/user/joe/WordCountOutput我期待在文件系统上创建一些东西。但我没有看到/user/joe/创建。请指教。 最佳答案 默认情况下,HDInsight使用Azureblob存储作为其HDFS存储,因此您的输出位于与集群关联的存储帐户中。你可以使用类似C

hadoop - 你可以用 hadoop-mapreduce-examples-2.2.0.jar 做什么?

关闭。这个问题需要detailsorclarity.它目前不接受答案。想改进这个问题吗?通过editingthispost添加细节并澄清问题.关闭8年前。Improvethisquestion我是Hadoop的新手,想了解安装时附带的jar文件。我一直在使用hadoop-mapreduce-examples-2.2.0.jar运行wordcount测试。一切进展顺利,但我想知道除了wordcount之外,我还能用这个jar文件或其他可用的jar文件做什么?

当我尝试在 YARN 上运行 pi-example 时,Hadoop2.5.2 卡在了 Running Job

我在3台装有UbuntuServer14.04的机器上运行Hadoop2.5.2一个是namenode和resourcemanager,ip是192.168.3.1其他的是运行datanode和nodemanager的slave,ip分别是192.168.3.102和192.168.3.104。我可以毫无错误地运行start-hdfs.sh和start-yarn.sh。HDFS和YARN的网站运行良好,我可以在浏览器上访问这两个网站并查看两个从站的状态。但是当我尝试通过yarnjarhadoop-mapreduce-examples-2.5.2.jarpi14在~/hadoop/sha