草庐IT

existing_start

全部标签

hadoop - Spark 独立模式 : Worker not starting properly in cloudera

我是spark的新手,在使用cloudera管理器中提供的包裹安装spark之后。我已经配置了以下来自clouderaenterprise的链接中所示的文件:http://www.cloudera.com/content/cloudera-content/cloudera-docs/CM4Ent/4.8.1/Cloudera-Manager-Installation-Guide/cmig_spark_installation_standalone.html完成此设置后,我通过运行/opt/cloudera/parcels/SPARK/lib/spark/sbin/start-all.s

java - 运行 start-dfs.sh 后无法启动 namenode (hadoop 2.7.1)

当尝试构建本地伪Hadoop环境时,当我尝试使用start-dfs.sh启动我的namenode时出现此错误"Couldnotfindorloadmainclassorg.apache.hadoop.hdfs.tools.GetConf"我的java版本如下图javaversion"1.7.0_85"OpenJDKRuntimeEnvironment(IcedTea2.6.1)(7u85-2.6.1-5ubuntu0.14.04.1)OpenJDK64-BitServerVM(build24.85-b03,mixedmode)我还更改了hadoop-env.sh中的行,位于/usr/l

hadoop - 配置单元 get_json_object() : How to check if JSON field exists?

我正在使用Hive和get_json_object()函数来查询存储为JSON的数据。JSON有一个coordinate键和两个字段(纬度和经度),如下所示:"coordinate":{"center":{"lat":36.123413127558536,"lng":-115.17381648045654},"precision":10}我正在运行Hive查询以检索某个地理坐标框中的数据,如下所示:INSERTOVERWRITELOCALDIRECTORY'/home/user.name/sample/sample1.txt'SELECT*FROMmytableWHEREget_jso

hadoop - 有没有办法在 pig 脚本中检查 "Path or file exists"

在我的hadoop环境中,输出目录是动态创建的。因此,我想动态地读取输出目录,如果存在路径或文件,则执行此操作,否则执行此操作。那么有什么方法可以检查pig脚本中的“路径或文件是否存在”?? 最佳答案 在Pig中,您可以运行shell命令来测试路径是否存在,如果存在则返回该路径,否则返回其他始终可用的空数据路径。然后依赖Pig的参数替换。例如:%declareemptyPath'/user/me/emptyData.csv'%declarerequestedPath'/user/me/realData.csv'%declareact

hadoop - start-mapred.sh 的替代品是什么?

我正在阅读有关Hadoop的书,其中提到了脚本start-mapred.sh。我下载了最新版的Hadoop,里面没有start-mapred.sh脚本。我看到有start-yarn.sh但它会启动JobTracker和TaskTracker组件吗? 最佳答案 Yarn是MapReduce的下一个版本,它不使用作业和任务跟踪器,而是使用资源管理器来完成它的工作。对于MRv1,使用2.3.0版本的hadoop。同样的程序也可以使用Yarn运行。启动hadoop只需使用start-all.sh或start-dfs.sh和start-yar

hadoop - Spark : Saving RDD in an already existing path in HDFS

我可以使用saveAsTextFile方法将RDD输出保存到HDFS。如果文件路径已经存在,此方法将抛出异常。我有一个用例,我需要将RDDS保存在HDFS中已有的文件路径中。有没有一种方法可以将新的RDD数据附加到同一路径中已经存在的数据中? 最佳答案 自Spark1.6以来可用的一种可能的解决方案是使用具有text格式和append模式的DataFrames:valoutputPath:String=???rdd.map(_.toString).toDF.write.mode("append").text(outputPath)

IE11(Win11)selenium自动化报This is the initial start page for the WebDriver server.解决方案

本人使用IE11一直报ThisistheinitialstartpagefortheWebDriverserver.错误,搜了很多方法例如修改Internet选项、修改注册表等等都试了,就是没有解决。修改Internet选项,win11和网上搜出的结果,基本都不一样,所以解决无效注册表也改了,也没用使用python代码修改窗口缩放比例,也试了,也没用zoom_level=driver.execute_script('return(window.outerWidth/window.innerWidth)')print(zoom_level)ifzoom_level>1:driver.execut

hadoop - java.sql.SQLException : Failed to start database '/var/lib/hive/metastore/metastore_db' in hive 异常

我是hive的初学者。当我尝试执行任何配置单元命令时:hive>显示表格;它显示以下错误:FAILED:Errorinmetadata:javax.jdo.JDOFatalDataStoreException:Failedtostartdatabase'/var/lib/hive/metastore/metastore_db',seethenextexceptionfordetails.NestedThrowables:java.sql.SQLException:Failedtostartdatabase'/var/lib/hive/metastore/metastore_db',se

hadoop - 使用 start-all.sh 启动 hadoop 进程遇到问题

关闭。这个问题是off-topic.它目前不接受答案。想改进这个问题吗?Updatethequestion所以它是on-topic用于堆栈溢出。关闭10年前。Improvethisquestion我正在使用redhatlinux4.1.2当我尝试使用以下命令启动hadoop时,它要求输入root@localhost密码。我不明白这里要输入什么密码。sreenath@sreenath-pc#sudo-i[root@sreenath-pchadoop-1.1.1]#bin/start-all.shWarning:$HADOOP_HOMEisdeprecated.startingnameno

java - hadoop、 Jersey 和 JBoss : application won't start

首先,我对JBoss几乎一无所知。昨天之前从来没有接触过它,仍然不太了解它。但是,我公司的一位客户正在使用它来部署我们的应用程序,而我们的最新更新破坏了他们的配置,所以我正在努力解决它。无论如何,这是版本信息:Hadoop:2.7.2Jersey:2.3JBoss:6.1操作系统:Windows(我怀疑这是特定于操作系统的,那只是我正在处理的环境)我们最近向我们的应用程序添加了一个Hadoop连接器模块,这似乎是导致失败的原因。我已经能够重现这个问题,这里是堆栈跟踪:13:32:39,857ERROR[org.jboss.msc.service.fail](MSCservicethre