草庐IT

find_one

全部标签

java - "Error: Could not find or load main class"启动Hadoop时

我正在尝试在我的Windows7机器上运行Hadoop(2.2.0)(是的,我知道在Linux上运行它会更好,但目前不是一个选项)。我按照http://ebiquity.umbc.edu/Tutorials/Hadoop/14%20-%20start%20up%20the%20cluster.html上发布的说明进行操作和http://blog.sqltrainer.com/2012/01/installing-and-configuring-apache.html在我尝试启动Hadoop之前,一切都很顺利。我尝试运行的每个操作都以:Error:Couldnotfindorloadma

hadoop - 错误 1128 : Cannot find field dryTemp

我的pig运行代码temperature而我报错,把代码和报错放在下面,方便理解我的问题发生了。错误在第38行第15列,尝试删除dryTemp,又报错。代码:--Loadfilesintorelationsmonth1=LOAD'hdfs:/data/big/data/weather/weather/201201hourly.txt'USINGPigStorage(',');month2=LOAD'hdfs:/data/big/data/weather/weather/201202hourly.txt'USINGPigStorage(',');month3=LOAD'hdfs:/dat

java - hadoop2.7.2 :cannot find java

我正在使用Hadoop2.7.2和CentOS7。当我尝试在终端中运行它时,出现了这个错误:/usr/hadoop/bin/hdfs:line304:/usr/lib/jvm/java-1.8.0-openjdk/bin/java:nosuchfileordirectory当我echo$JAVA_HOME时:/usr/lib/jvm/java-1.8.0-openjdk在/etc/profileexportJAVA_HOME=/usr/lib/jvm/java-1.8.0-openjdkexportCLASSPATH=.:$CLASSPATH:$JAVA_HOME/lib:$JAVA_

hadoop - java.lang.IllegalArgumentException : Can't find HmacSHA1 algorithm 异常

通过brewinstallhadoop安装hadoop后,我想启动hadoop,在mac上运行hadoop2.7.2/start-all.sh时出错,日志:SwingHu19:53:4516/08/1919:50:25INFOnamenode.FSNamesystem:fsOwner=swinghu(auth:SIMPLE)16/08/1919:50:25INFOnamenode.FSNamesystem:supergroup=supergroup16/08/1919:50:25INFOnamenode.FSNamesystem:isPermissionEnabled=true16/0

java - 使用 Windows 10 和命令行 : ERROR the system cannot find the file hadoop 启动 Hadoop 2.7.1

我正在尝试使用命令行在我的计算机(Windows10)上安装和启动Hadoop2.7.1,为此我遵循了来自不同网站的步骤。我配置了系统变量和Hadoop(编辑etc文件夹中的一些文件:Hadoop-env.cmd、core-site.xml、mapred-site.xml,yarn-site.xml,hdfs-site.xml)并下载一个新的bin文件夹。我目前正在尝试启动Hadoop,并且已成功执行命令hdfsnamenode-format。但是,当在命令提示符下指向sbin文件夹并尝试执行start-dfs.cmd时,我收到一条错误消息:系统找不到文件hadoop.任何人都知道我应

hadoop - pig 错误 0 : Scalar has more than one row in the output

我有两个文件,我试图在模式匹配的基础上加入这两个文件。File1:weather.bbc.co.uk,112ads.facebook.com,113ads.amazon.co.uk,114www.sky.com,115news.bbc.co.uk,116pics.facebook.com,117File2:facebook.com,facebookbbc.co.uk,bbcnetflix.com,netflixflipkart.com,flipkartoutput:weather.bbc.co.uk,112,bbc.co.uk,bbcads.facebook.com,113,faceb

linux - hadoop 配置 : couldn load or find main class org. apache.hadoop

我正在尝试学习hadoop,我正在学习pluralsight的“hadoop构建block”类(class),我正在尝试通过伪分布式模式运行hadoop,当我运行以下命令时:bin/hadoopjarshare/hadoop/mapreduce/hadoop-mapreduce-examples-3.0.3.jargrep输入输出'dfs[a-z.]+'我得到以下输出:Applicationapplication_1530031734419_0001failed2timesduetoAMContainerforappattempt_1530031734419_0001_000002ex

scala - Spark 流 : Write Data to HDFS by reading from one HDFSdir to another

我正在尝试使用SparkStreaming将数据从一个HDFS位置读取到另一个位置下面是我在spark-shell上的代码片段但我看不到在HDFS输出目录上创建的文件能否指出如何在HDFS上加载文件scala>sc.stop()scala>importorg.apache.spark.SparkConfscala>importorg.apache.spark.streamingscala>importorg.apache.spark.streaming.{StreamingContext,Seconds}scala>valconf=newSparkConf().setMaster("l

hadoop - Hive 3.1.1安装问题: Cannot find hadoop installation: $HADOOP_HOME or $HADOOP_PREFIX must be set or hadoop must be in the path

感谢有关tutorialspoint和stackoverflow的有用信息,我几乎完成了在OracleVirtualBox上的Ubuntu上安装Hive3.1.1和Hadoop3.0.3。我尝试从$HIVE_HOME运行“bin/hive”并收到以下错误:"Cannotfindhadoopinstallation:$HADOOP_HOMEor$HADOOP_PREFIXmustbesetorhadoopmustbeinthepath."我编辑了bashrc以包括:exportHADOOP_HOME=/usr/local/hadoop....exportPATH=$PATH:$HADOO

scala - Spark : Would a dataframe repartitioned to one node experience a shuffle when a groupBy is called on it?

假设我有一些数据都在同一个分区上(我之前在数据帧上执行了.coalesce(1))。我现在想对数据进行分组并对其进行聚合。如果我在数据框上使用.groupBy,这些组会被放置到不同的节点上吗?如果这是真的,我想避免这种情况,因为我想对这些组执行这些计算而不需要过多改组。 最佳答案 首先,coalesce(1)并不能保证你的所有数据都在一个节点中,要确保你必须使用repartition(1),这将迫使您将所有数据统一在一个节点中。coalesce仅对同一节点中的分区进行分组,因此如果您的数据分布在5个节点中(每个节点中有多个分区),它