Property

hadoop - 资源管理器没有节点

编辑:我看过YARNResourcemanagernotconnectingtonodemanager该解决方案对我不起作用。我附上了与资源管理器建立连接的节点管理器日志部分:[main]client.RMProxy(RMProxy.java:createRMProxy(98))-ConnectingtoResourceManagerat/0.0.0.0:80312016-06-1719:01:04,697INFO[main]nodemanager.NodeStatusUpdaterImpl(NodeStatusUpdaterImpl.java:getNMContainerStatus

hadoop 资源管理 property gt lt docker hadoop-yarn cloudera

Hadoop 和 Hive 中的 Hadoop LZO 和 SnappyCodec 错误

我正在使用Ubuntu-12.04,Hadoop-1.0.2,Hive-0.10.0从hive中读取大约100万条记录的数据时出现以下查询错误select*fromraw_poslimit10000;WARNutil.NativeCodeLoader:Unabletoloadnative-hadooplibraryforyourplatform...usingbuiltin-javaclasseswhereapplicable所以我在$HADOOP_HOME/lib文件夹中安装了SnappyforHadoop，它生成文件libsnappy.a、libsnappy.la、libsnapp

Hadoop SnappyCodec gt lt property hive lzo snappy

apache - 我的 Yarn Map-Reduce 作业花费了大量时间

输入文件大小:75GB映射器数量:2273reducer数量:1(如网页界面所示)分割数:2273输入文件数:867集群:ApacheHadoop2.4.05个节点集群，每个1TB。1个主节点和4个数据节点。已经4小时了。现在仍然只完成了12%的map。只是想知道我的集群配置是否有意义，或者配置有什么问题吗？Yarn-site.xmlyarn.nodemanager.aux-servicesmapreduce_shuffleyarn.nodemanager.aux-services.mapreduce.shuffle.classorg.apache.hadoop.mapred.Shuf

Map-Reduce apache lt gt property hadoop mapreduce cluster-computing hadoop-yarn

python - Spark 簇错误: ClassNotFoundException

我使用spark框架处理大数据、hadoop文件系统和集群管理器YARN。当我尝试使用命令spark-submit--deploy-modecluster--masteryarnstreaming.py运行我的python应用程序时我收到一个错误:16/12/1915:42:44WARNutil.NativeCodeLoader:Unabletoloadnative-hadooplibraryforyourplatform...usingbuiltin-javaclasseswhereapplicableExceptioninthread"main"java.lang.RuntimeE

ClassNotFoundException python gt lt property hadoop apache-spark hdfs hadoop-yarn

hadoop - yarn : How to make Yarn utilize more memory and vcores

我们有一个由Yarn管理并运行hadoop的5节点集群1Masternamenode8vcoresand24GBmemory4个数据节点，每个节点8个vcores和24GB内存当我在ui上查看Yarn配置时，如下图中突出显示的那样，它仅使用16GB和6个vcores我们的应用程序正在使用所有16gb，因此想要增加内存，因为它可用(24-2gbforos所以可用是22gb)我需要在哪里配置这个22gb而不是16gb？根据研究发现yarn-site.xml可能是这个地方所以继续更新它并重新启动yarn但它仍然显示16gb如果社区中的任何专家能提供帮助，我们将不胜感激，因为我们是Yarn的新

utilize hadoop gt lt property hadoop-yarn hadoop2

windows - 无法从 IE 中找到凭据导致 HDFS WebUI Kerberos 身份验证失败

我使用kerberos身份验证设置我的HDFS服务，这就是配置:hadoop.http.filter.initializersorg.apache.hadoop.security.AuthenticationFilterInitializerhadoop.http.authentication.typekerberoshadoop.http.authentication.simple.anonymous.allowedfalsehadoop.http.authentication.signature.secret.file/opt/hadoop/hdfs/default/etc/had

凭据 Kerberos property gt lt windows hadoop authentication hdfs

Hadoop 2.7.0 - MapReduce 作业未运行 - 因 AM 容器错误而失败

我在Fedora22虚拟机上以伪节点模式使用Hadoop2.7.0。几天前，MapReduce作业运行良好，但在安装Oozie并对yarn-site.xml进行了修改之后。我在运行Pi示例作业时遇到以下错误，我可能无法调试错误，已编辑-我使用命令行运行作业，不使用oozie工作流引擎..命令-hadoopjar10100StartingJob15/12/1715:22:05INFOclient.RMProxy:ConnectingtoResourceManagerat/192.168.122.1:803215/12/1715:22:06INFOinput.FileInputFormat

容器 MapReduce hadoop property

java - 作业完成后，hadoop 2.7.2 多节点中的作业历史 Web ui-19888 不显示任何内容

在hadoop2.7.2中用2个从属运行作业后，我可以在终端中看到结果，但在master:19888/jobhistory中什么也没有。我上传了图片和我的配置文件。jobhistorywebui19888这是我的配置文件。核心.site.xmlfs.default.namehdfs://master:9000hadoop.tmp.dir/app/hadoop/tmphdfs.site.xmldfs.replication2dfs.name.dirfile:/usr/local/hadoop/hadoop_tmp/hdfs/namenodedfs.data.dirfile:/usr/lo

点中 hadoop property gt lt java maven hadoop-yarn hadoop2

hadoop - Nutch 2.3.1 只抓取种子网址

种子 hadoop gt lt property web-crawler nutch

python - 尝试启动 PySpark 时出现空指针异常

我正在使用以下命令启动pyspark./bin/pyspark--masteryarn--deploy-modeclient--executor-memory5g我得到以下错误15/10/1417:19:15INFOspark.SparkContext:SparkContextalreadystopped.Traceback(mostrecentcalllast):File"/opt/spark-1.5.1/python/pyspark/shell.py",line43,insc=SparkContext(pyFiles=add_files)File"/opt/spark-1.5.1/

时出 PySpark gt lt property python hadoop apache-spark

72 73 747576 77 78