yarn-error

hadoop - 如何在 yarn 中查看非 mapreduce 作业的历史日志

我已经配置了yarn的historyserver。但是貌似只能帮我看mapreducejobs的历史日志。我仍然看不到非mapreduce作业的日志。如何查看非mapreduce作业的历史日志？最佳答案这是一项正在进行的工作。请看https://issues.apache.org/jira/browse/YARN-321和https://issues.apache.org/jira/browse/YARN-1530. 关于hadoop-如何在yarn中查看非mapreduce作业的历

何在 mapreduce section https hadoop hadoop-yarn

Hive表字段类型转换错误解决：Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask.

文章目录1问题场景1.1问题发生的背景1.1操作方法11.2操作方法21.3报错信息2问题分析3解决方法3.1在SQL代码中加参数3.2在提交Hive程序时，附加上hiveconf参数3.3修改hive-site.xml文件1问题场景假设某有数据的Hive表temp_table的字段状况如下，需要将A字段由string类型转为int类型：字段名称字段类型是否为分区字段Astring否Bint否Cbigint否Dstring是1.1问题发生的背景在Hdfs数据库中，该表的数据是以Parquet文件格式存储的，包含多个分区。原本在该表中的字段A的类型为int。然而笔者误操作，将该字段的类型转换为了

表字 Execution span class token spark 数据库 hive

apache - 我的 Yarn Map-Reduce 作业花费了大量时间

输入文件大小:75GB映射器数量:2273reducer数量:1(如网页界面所示)分割数:2273输入文件数:867集群:ApacheHadoop2.4.05个节点集群，每个1TB。1个主节点和4个数据节点。已经4小时了。现在仍然只完成了12%的map。只是想知道我的集群配置是否有意义，或者配置有什么问题吗？Yarn-site.xmlyarn.nodemanager.aux-servicesmapreduce_shuffleyarn.nodemanager.aux-services.mapreduce.shuffle.classorg.apache.hadoop.mapred.Shuf

Map-Reduce apache lt gt property hadoop mapreduce cluster-computing hadoop-yarn

cv2.error: OpenCV(4.8.1) :-1: error: (-5:Bad argument) in function ‘rectangle‘ ＞ Overload resolution

报错记录cv2.error:OpenCV(4.8.1):-1:error:(-5:Badargument)infunction'rectangle'>Overloadresolutionfailed:> -Argument'thickness'isrequiredtobeaninteger> -Argument'thickness'isrequiredtobeaninteger> -argumentforrectangle()givenbyname('thickness')andposition(4)> -argumentforrectangle()givenbyname('thickness

error lsquo thickness 39 rectangle opencv javascript 前端

hadoop - 为具有多个 spark 客户端的 yarn 集群计算 yarn.nodemanager.resource.cpu-vcores

如果我有3个spark应用程序都使用同一个yarncluster，我应该如何设置yarn.nodemanager.resource.cpu-vcores在3个yarn-site.xml中的每一个？(每个spark应用程序都需要在类路径上有自己的yarn-site.xml)这个值在客户端yarn-site.xml中是否重要？如果是:假设集群有16个核心。每个yarn-site.xml中的值是否应该为5(总共15，为系统进程留下1个核心)？或者我应该将每个设置为15吗？(注意:Cloudera表示此处应为系统进程保留一个核心:http://blog.cloudera.com/blog/20

yarn nodemanager section spark hadoop apache-spark hadoop-yarn

maven - org.datanucleus.exceptions.NucleusUserException : Error : Could not find API definition for name "JDO"

我试图通过hcatalog访问mapreduce中的配置单元表并面临以下异常:我用谷歌搜索并试图找到根本原因，但没有成功，所以我在这里发布我的查询。2016-12-0115:48:35,855INFO[main]metastore.HiveMetaStore(HiveMetaStore.java:newRawStore(564))-0:Openingrawstorewithimplementationclass:org.apache.hadoop.hive.metastore.ObjectStore2016-12-0115:48:35,857INFO[main]metastore.Ob

NucleusUserException datanucleus gt lt artifactId maven hadoop hive hcatalog

hadoop - 错误 : while processing statement: FAILED: Hive Internal Error: hive. mapred.supports.subdirectories 必须为真

我遇到了一个错误Errorwhileprocessingstatement:FAILED:HiveInternalError:hive.mapred.supports.subdirectoriesmustbetrueifanyoneoffollowingistrue:hive.optimize.listbucketing,mapred.input.dir.recursiveandhive.optimize.union.remove.当我尝试从HDFS目录递归加载数据到hive表时发生此错误我尝试设置以下参数:SETmapred.input.dir.recursive=true;SETh

subdirectories processing section blockquote mapred hadoop recursion optimization hive bigdata

hadoop - yarn : How to make Yarn utilize more memory and vcores

我们有一个由Yarn管理并运行hadoop的5节点集群1Masternamenode8vcoresand24GBmemory4个数据节点，每个节点8个vcores和24GB内存当我在ui上查看Yarn配置时，如下图中突出显示的那样，它仅使用16GB和6个vcores我们的应用程序正在使用所有16gb，因此想要增加内存，因为它可用(24-2gbforos所以可用是22gb)我需要在哪里配置这个22gb而不是16gb？根据研究发现yarn-site.xml可能是这个地方所以继续更新它并重新启动yarn但它仍然显示16gb如果社区中的任何专家能提供帮助，我们将不胜感激，因为我们是Yarn的新

utilize hadoop gt lt property hadoop-yarn hadoop2

hadoop - 如何从 `yarn application -list` 访问 Tracking-URL？

我想查看我在yarn中看到的某个作业的yarnwebUI。当我做yarnapplication-list我可以看到跟踪URL.所以，我在chrome中导航到那个页面，它给了我这样的错误:The172.12.15.181pageisn'tworking.172.12.15.181didn'tsendanydata.我显然已经通过ssh进入了应该允许我看到它的机器。另外，这份工作肯定在status=RUNNING在yarn中。那么，是什么阻止我在这个url上看到yarnweb用户界面？我这样做正确吗？谢谢。最佳答案在yarnappl

Tracking-URL application section code yarn hadoop apache-spark pyspark hadoop-yarn

hadoop - hadoop 和 yarn 可以使用相同的代码吗

我一直在思考这个问题。我一直在尝试通过运行基本字数统计示例来比较hadoop1与yarn的性能。我仍然不确定如何使用同一个.jar文件在两个框架上执行。据我了解，yarn有一组不同的api，用于设置与资源管理器的连接、创建应用程序主机等。因此，如果我开发一个应用程序(.jar)，它是否可以在两个框架上运行而无需更改代码？另外，对于特定应用程序，哪些参数可能是区分hadoop与yarn的有意义的参数？最佳答案好的，让我们在这里澄清一些术语。Hadoop是一个伞状系统，包含分布式存储和处理所需的各种组件。当您说hadoop1时，我相

hadoop yarn strong section 跟踪器 hadoop-yarn

177 178 179180181 182 183