主_草庐IT

hadoop - Spark 将本地文件从主节点分发到节点

我以前在本地运行Spark并将文件分发到节点从来没有给我带来问题，但现在我正在将东西转移到Amazon集群服务并且事情开始崩溃。基本上，我正在使用MaxmindGeoLiteCity.dat处理一些IP，我将其放置在主服务器的本地文件系统上(file:///home/hadoop/GeoLiteCity.dat)。根据之前的一个问题，我使用了sc.addFile:sc.addFile("file:///home/hadoop/GeoLiteCity.dat")并使用类似的方式调用它:valipLookups=IpLookups(geoFile=Some(SparkFiles.get("

分发 hadoop GeoLiteCity section code amazon-web-services apache-spark

hadoop - 无法连接到docker主机外的docker容器

我在ubuntu上运行了两个docker容器，其中一个用于hadoopnamenode，另一个用于hadoopdatanode。现在我的java代码在Windows上运行，使用HadoopFileSystemapi将文件从我的Windows文件系统复制到远程dockerhdfs。importorg.apache.hadoop.conf.Configuration;importorg.apache.hadoop.fs.FileSystem;importorg.apache.hadoop.fs.FileUtil;importorg.apache.hadoop.fs.Path;importo

机外 docker hadoop apache

java - 无法找到或加载主类 org.apache.hadoop.mapreduce.v2.app.MRAppMaster

mapred-site.xml的内容:mapreduce.framework.nameyarnyarn.app.mapreduce.am.envHADOOP_MAPRED_HOME=/home/admin/hadoop-3.1.0mapreduce.map.envHADOOP_MAPRED_HOME=/home/admin/hadoop-3.1.0mapreduce.reduce.envHADOOP_MAPRED_HOME=/home/admin/hadoop-3.1.0mapreduce.application.classpath$HADOOP_MAPRED_HOME/share/h

MRAppMaster mapreduce HADOOP_MAPRED_HOME HADOOP java hadoop3

apache - Sqoop - 无法找到或加载主类 org.apache.sqoop.Sqoop

我安装了Hadoop、Hive、HBase、Sqoop并将它们添加到PATH中。当我尝试执行sqoop命令时，出现此错误:Error:Couldnotfindorloadmainclassorg.apache.sqoop.Sqoop开发环境:操作系统:Ubuntu12.0464位Hadoop版本:1.0.4hive版本:0.9.0Hbase版本:0.94.5Sqoop版本:1.4.3 最佳答案确保您的SQOOPHOME目录下有sqoop-1.4.3.jar。注意:可能是因为您在SqoopDistribution下下载了错误的发行版

apache Sqoop strong section hadoop hbase hive

docker - 无法增加最大应用程序主资源

我正在使用uhopper/hadoopdocker镜像来创建yarn集群。我有3个节点，每个节点有64GBRAM。我已经添加了配置。我给了32GByarn。因此集群总内存为96GB。-name:YARN_CONF_yarn_scheduler_minimum___allocation___mbvalue:"2048"-name:YARN_CONF_yarn_scheduler_maximum___allocation___mbvalue:"16384"-name:MAPRED_CONF_mapreduce_framework_namevalue:"yarn"-name:MAPRED_C

docker 无法 section value 34 hadoop hadoop-yarn

hadoop - Apache Giraph - 无法在分离主/工作模式下运行，因为一次只有 1 个任务

我使用PageRankBenchmark示例运行Giraph1.0.0和hadoop2.2.0here.突然我得到这个错误结果:Exceptioninthread"main"java.lang.IllegalArgumentException:checkLocalJobRunnerConfiguration:WhenusingLocalJobRunner,musthaveonlyoneworkersinceonly1taskatatime!atorg.apache.giraph.job.GiraphJob.checkLocalJobRunnerConfiguration(GiraphJ

hadoop Apache java giraph mapreduce

hadoop - 可以找到或加载主类 org.apache.nutch.crawl.InjectorJob

我将Linux与Hadoop、Cloudera和HBase结合使用。你能告诉我如何纠正这个错误吗？错误:无法找到或加载主类org.apache.nutch.crawl.InjectorJob以下命令给了我错误:src/bin/nutchinjectcrawl/crawldbdmoz/如果您需要任何其他信息，请找我。最佳答案我认为您可能错过了一两步。请确认:您是否安装了ApacheANT然后导航到nutch文件夹并输入“ant”？您是否设置了环境变量:NUTCH_JAVA_HOME:要使用的java实现。覆盖JAVA_HOME。N

InjectorJob hadoop code NUTCH section solr

hadoop - Yarn 从属节点不与主节点通信？

当我这样做时我无法看到我的节点yarnnode-list,即使我配置了/etc/hadoop/conf/yarn-site.xml具有正确的属性(在我看来，至少根据这个问题SlavenodesnotinYarnResourceManager)。这是我到目前为止所做的:已安装resourcemanager在主人身上已安装nodemanager在奴隶上检查yarn-site.xml为此在所有节点上:yarn.resourcemanager.hostnamemaster-node修改配置文件后，重启resourcemanager和nodemanager分别在主从上。但是当我这样做时yarnn

从属 hadoop code resourcemanager yarn apache-spark hadoop-yarn

apache - HADOOP/YARN - ResourceManager 和 hdfs NameNode 是否总是安装在同一台主机上？

“资源管理器”和“hdfsnamenode”是否总是安装在同一台主机上？1)当我想向getnewapplicationid发送http请求(YARNRESTAPI)时我正在使用这个网络uri:http:///ws/v1/cluster/apps/new-application此端口是Resource-ManagerWebUI的http端口，默认值为8088，如img1所示:sourceforimg12)当我想为hdfs命令发送一个http请求(WebHDFSRESTAPI)时，例如getfilestatus我正在使用这个网络uri:http://:/webhdfs/v1/?op=GET

机上 ResourceManager http noreferrer section apache rest hadoop hadoop-yarn webhdfs

java - 尝试格式化 namenode 时找不到或加载主类； hadoop 在 MAC OS X 10.9.2 上的安装

我正在尝试使用hadoop在我的MACOSX10.9.2上完成开发单节点集群设置。我尝试了各种在线教程，最近的是thisone.总结一下我所做的:1)$brewinstallhadoop这在/usr/local/Cellar/hadoop/2.2.0中安装了hadoop2.2.02)配置的环境变量。这是我的.bash_profile的相关部分:###Java_HOMEexportJAVA_HOME="$(/usr/libexec/java_home)"###HADOOPEnvironmentvariablesexportHADOOP_PREFIX="/usr/local/Cellar/

namenode hadoop gt lt java macos mapreduce