user_worker_草庐IT

apache-spark - 什么是 hadoop(单节点和多节点)、spark-master 和 spark-worker？

我想了解以下术语:hadoop(单节点和多节点)Spark大师星火worker名称节点数据节点到目前为止我的理解是sparkmaster是工作执行者并处理所有sparkworker。而hadoop是hdfs(我们的数据所在的地方)，sparkworker根据给他们的工作从那里读取数据。如果我错了，请纠正我。我也想了解namenode和datanode的作用。虽然我知道namenode的作用(拥有所有数据节点的元数据信息，最好只有一个，但可以是两个)并且数据节点可以是多个并拥有数据。datanodes是同一个hadoop节点吗？最佳答案

hadoop - org.apache.hadoop.security.AccessControlException : Permission denied: user=test-user, access=EXECUTE, inode ="system":hadoop:test-user:rwx------

以前测试用户曾经驻留在连接丢失的边缘服务器上。因此，我们重建了边缘服务器并一直在尝试启动并运行它，但我一直收到以下错误。Jobinitializationfailed:org.apache.hadoop.security.AccessControlException:org.apache.hadoop.security.AccessControlException:Permissiondenied:user=test-user,access=EXECUTE,inode="system":hadoop:test-user:rwx------atsun.reflect.GeneratedC

hadoop test-user apache java

java - hive 达到 max worker 并且无法连接到 hiveserver2

当我使用直线连接到hiveserver2时，错误消息是这样的。我之前已经连接到hiveserver2。在我连接到hiveserver2几次后显示此错误。我可以连接使用jdbc:hive2://beeline>!connectjdbc:hive2://master:10000SLF4J:类路径包含多个SLF4J绑定(bind)。SLF4J:在[jar:file:/usr/local/hive/lib/log4j-slf4j-impl-2.4.1.jar!/org/slf4j/impl/StaticLoggerBinder.class]中找到绑定(bind)SLF4J:在[jar:file

hiveserver2 hiveserver hive lt gt java hadoop apache-spark

java - dfs.data.dir : Failed to set permissions of path:\tmp\hadoop-user\dfs\data to 0755 中的无效目录

我是hadoop框架的新手，目前我正在处理大数据项目，在Windows7中使用cygwin、hadoop-0.19.1、eclipse-3.3.1(Europa)。现在我正在尝试从hadoop-0.19进行更改.1到hadoop-1.2.1version.i如下配置hadoop-1.2.1核心站点.xml:fs.default.namehdfs://localhost:9100hdfs.xmldfs.replication1mapred-site.xmlmapred.job.trackerlocalhost:9101但是我在启动数据节点时出错，如下所示$bin/hadoopdatano

data hadoop-user hadoop gt lt java eclipse cygwin

linux - 运行 hadoop 集群时在 Google Cloud Platform 上获取 'sudo: unknown user: hadoop' 和 'sudo: unable to initialize policy plugin error'

我正在尝试部署Google在https://github.com/GoogleCloudPlatform/solutions-google-compute-engine-cluster-for-hadoop提供的示例Hadoop应用程序在谷歌云平台上。我逐步按照那里给出的所有设置说明进行操作。我能够设置环境并成功启动集群。但是我无法运行MapReduce部分。我正在我的终端上执行这个命令:./compute_cluster_for_hadoop.pymapreduce[--prefix]--inputgs://\--outputgs://\--mappersample/shortest

amp hadoop compute cluster linux google-compute-engine google-cloud-platform google-hadoop

hadoop - MapReduce 作业作为用户在/user/yarn/.staging 目录上获得权限错误运行

我有一个运行Hive操作的Oozie工作流。配置单元操作非常简单，它只是从一个表中读取副本到另一个表。该作业具有以下属性:user.name=yarnmapreduce.job.user.name=cloudfeeds作业失败并出现以下错误:15/07/1618:45:25INFOmapreduce.Job:Jobjob_1435680786374_0060failedwithstateFAILEDdueto:Applicationapplication_1435680786374_0060failed2timesduetoAMContainerforappattempt_143568

MapReduce staging hadoop apache java hive hadoop-yarn oozie

hadoop - 运行 YARN 应用程序时获取 "User [dr.who] is not authorized to view the logs for application <AppID>"

我在HDP2.5集群中使用ApacheTwill运行自定义Yarn应用程序，但是当我转到我的容器网页时，我无法看到我自己的容器日志(syslog、stderr和stdout):当我导航到此页面时，登录名也从我的kerberos更改为“dr.who”。但是我可以看到map-reduce作业的日志。Hadoop版本为2.7.3，集群启用了yarnacl。最佳答案我在使用hadoopui时遇到了这个问题。我在this中找到doc，hadoop.http.staticuser.user默认设置为dr.who，您需要将其包含在相关设置文件

amp application section hadoop noreferrer mapreduce hadoop-yarn hadoop2 apache-twill

Hadoop HDFS : input/output error when creating user folder

我已按照Hadoopthedefinitiveguide,4thedition:AppendixA中的说明进行操作在伪分布式模式下配置Hadoop。一切正常，除了我尝试创建目录时:hadoopfs-mkdir-p/user/$USER命令返回以下消息:mkdir:/user/my_user_name':Input/outputerror。虽然，当我第一次登录到我的根帐户sudo-s然后键入hadoopfs-mkdir-p/user/$USER命令时，目录'user/root'被创建(路径中的所有目录)。我想我遇到了Hadoop权限问题。任何帮助将不胜感激，谢谢。

creating Hadoop section code hdfs

hadoop - 为什么 Apache Spark worker executor 以退出状态 1 被杀死？

apachespark独立设置中的所有工作人员都显示以下消息。worker:执行者app-20150902151146-0001/6已完成，状态为KILLEDexitStatus1收到此消息的原因是什么。最佳答案根据您提供的少量信息，我们只能笼统地回答这个问题。所以我的回答是从SeanOwen的answer得到的启发。关于worker和执行者之间的关系，也来自ResourceManagementwithYARN上的Cloudera博客以及关于Clustermodeoverview的官方文档.那么让我们开始定义ApacheSpar

杀死 executor strong section noreferrer hadoop apache-spark mapreduce spark-streaming

Hadoop 3.0.3 worker 文件与奴隶

在/etc/hadoop文件夹中，您必须创建的workers文件或slaves文件有区别吗？同样对于3.0.3，我还需要为namenode创建一个masters文件吗？最佳答案是的，不再使用奴隶。在纠结数据节点启动的几个小时后，我发现“workers”文件是你应该配置的，而不是从属文件。如果你这样做，它会被忽略。至少对我来说。将slave的内容复制给worker即可。它奏效了。希望这对您有所帮助。关于Hadoop3.0.3worker文件与奴隶，我们在StackOverflow上找

Hadoop worker section stackoverflow questions