草庐IT

previous_db_name

全部标签

hadoop - 当 Name Node 在 YARN 中失败时,工作状态是什么?

当一个job在集群中运行时,如果NameNode突然挂了,那么这个job的状态是什么(failed或者killed)?如果失败意味着谁在更新作业状态?这在内部是如何工作的? 最佳答案 备用Namenode将通过故障转移过程变为事件Namenode。看看HowdoesHadoopNamenodefailoverprocessworks?YARN架构围绕着ResourceManager、NodeManager和ApplicationsMaster。作业将继续进行,而不会因名称节点故障而受到任何影响。如果以上三个进程中的任何一个失败,将根

java - 连接到 Kerberrized HDFS,java.lang.IllegalArgumentException : Failed to specify server's Kerberos principal name;

我正在尝试使用以下代码连接到Kerberizedhdfs集群,使用以下相同的代码我能够使用HBaseConfiguration访问hbaseofcourse,Configurationconfig=newConfiguration();config.set("hadoop.security.authentication","Kerberos");UserGroupInformation.setConfiguration(config);UserGroupInformationugi=null;ugi=UserGroupInformation.loginUserFromKeytabAnd

hadoop - 在 Windows 上安装 Titan DB 时出错

遵循TitanDB的官方指南here,并尝试运行命令:graph=TitanFactory.open('conf/titan-cassandra-es.properties')我遇到了这个错误:Backendshorthandunknown:conf/titan-cassandra-es.properties很明显,原因是的路径不正确titan-cassandra-es.properties文件。所以我将其更改为:graph=TitanFactory.open('../conf/titan-cassandra-es.properties')得到这个错误:Encounteredunreg

scala - 每个列值的 Spark 计数和百分比异常处理和加载到 Hive DB

在下面的ScalaSpark代码中,我需要找到不同列的计数及其值的百分比。为此,我需要对每一列使用withColumn方法,例如date、usage、payment、dateFinal,usageFinal,paymentFinal。对于每个计算,我都需要使用withColumn来获取总和和聚合。有什么方法可以让我不用写,.withColumn("SUM",sum("count").over()).withColumn("fraction",col("count")/sum("count").over()).withColumn("Percent",col("fraction")*10

scala - 使用 Spark hadoop API 创建 RDD 以访问 Cassandra DB

我正在运行一个节点cassandra2.0.3和ApacheSpark2.0.3我创建了一个scala程序来使用SparkhadoopAPI创建RDD以访问CassandraDB。还应该在bashrc中为spaark设置哪些环境变量,因为我在spark-env.sh中使用以下配置exportSPARK_MASTER_IP="10.0.3.15"exportSPARK_MASTER_PORT="7077"exportSCALA_HOME="/home/Desktop/CD/scala-2.9.3"exportSPARK_WORKER_MEMORY=1gexportSPARK_WORKER

hadoop - mapred-site.xml 中 mapreduce.framework.name 的经典、本地有什么区别?

官方对该参数的描述如下:TheruntimeframeworkforexecutingMapReducejobs.Canbeoneoflocal,classicoryarn.我知道值“yarn”用于MRv2,它会将mapreduce作业提交给resourcemanager。但是本地和经典之间有什么区别?哪个对应MRv1?非常感谢! 最佳答案 你是对的,“yarn”代表MRv2。“经典”用于MRv1,“本地”用于MR作业的本地运行。但是为什么需要MRv1?Yarn现在已经结束测试,它比旧的MRv1框架更稳定,而您的MapReduce作

hadoop - 安全模式异常 : Name node is in safe mode

我尝试将文件从我的本地磁盘复制到hdfs。起初它给出了SafeModeException。在寻找解决方案时,我读到如果再次执行相同的命令,问题就不会出现。所以我再次尝试,它没有给出异常。hduser@saket:/usr/local/hadoop$bin/hadoopdfs-copyFromLocal/tmp/gutenberg//user/hduser/gutenbergcopyFromLocal:org.apache.hadoop.hdfs.server.namenode.SafeModeException:Cannotcreatedirectory/user/hduser/gut

Hadoop 2.2.0 : "name or service not known" Warning

我的目标是在Ubuntu12.4上运行hadoop2.2.0。我能够做到,但是当我运行以下命令时:rushi@ubuntu:/usr/local/hadoop$sbin/start-dfs.sh我的dfs正在启动namenode、scondarynamenode和datanode,但问题是我收到警告rushi@ubuntu:/usr/local/hadoop$sbin/start-dfs.sh14/01/2412:05:46WARNutil.NativeCodeLoader:Unabletoloadnative-hadooplibraryforyourplatform...usingb

hadoop/hdfs/name 处于不一致状态 : storage directory(hadoop/hdfs/data/) does not exist or is not accessible

我已经尝试了stackoverflow提供的关于这个主题的所有不同解决方案,但没有帮助再次询问具体日志和详细信息感谢任何帮助我的Hadoop集群中有一个主节点和5个从节点。ubuntu用户和ubuntu组是~/Hadoop文件夹的所有者~/hadoop/hdfs/data&~/hadoop/hdfs/name文件夹都存在两个文件夹的权限都设置为755在启动脚本start-all.sh之前成功格式化namenode脚本无法启动“名称节点”这些都在主节点上运行ubuntu@master:~/hadoop/bin$jps7067TaskTracker6914JobTracker7237Jps

PostgreSQL荣获DB-Engines 2023年度数据库

数据库流行度排名网站DB-Engines2024年1月2日发布文章宣称,PostgreSQL荣获2023年度数据库管理系统称号。PostgreSQL在过去一年中获得了比其他417个产品更多的流行度增长,因此获得了2023年度DBMS。DB-Engines通过计算每种数据库2024年1月份的流行度与其2023年1月份流行度的差值,对不同数据库进行比较,从而评选出冠亚季军。冠军:PostgreSQLPostgreSQL第四次获取了年度DBMS,前三次分别是2017、2018以及2020。大约35年前,Postgres首次发布。多年以来,PostgreSQL获得成功的关键因素在于:持续不断的改进,D