草庐IT

cluster_block_exce

全部标签

hadoop - 如何使用 Hadoop WebHDFS 读取和传输文件 block ?

我需要将大文件(至少14MB)从FIWARE实验室的Cosmos实例传输到我的后端。我使用SpringRestTemplate作为HadoopWebHDFSRESTAPI的客户端接口(interface)here但是我遇到了IO异常:Exceptioninthread"main"org.springframework.web.client.ResourceAccessException:I/OerroronGETrequestfor"http://cosmos.lab.fiware.org:14000/webhdfs/v1/user//?op=open&user.name=":Trun

java - block 池 <registering> 初始化失败(Datanode Uuid 未分配)

此错误的来源是什么以及如何修复?2015-11-2919:40:04,670FATALorg.apache.hadoop.hdfs.server.datanode.DataNode:InitializationfailedforBlockpool(DatanodeUuidunassigned)servicetoanmol-vm1-new/10.0.1.190:8020.Exiting.java.io.IOException:Allspecifieddirectoriesarenotaccessibleordonotexist.atorg.apache.hadoop.hdfs.serve

scala - Cluster 模式下使用 Spark 写入文件到本地系统

我知道这是一种使用Spark的奇怪方式,但我正在尝试使用Spark将数据帧保存到本地文件系统(不是hdfs),即使我处于集群模式。我知道我可以使用客户端模式,但我确实想在集群模式下运行并且不关心哪个节点(3个中的)应用程序将作为驱动程序运行。下面的代码是我正在尝试做的伪代码。//createdataframevaldf=Seq(Foo("John","Doe"),Foo("Jane","Doe")).toDF()//saveittothelocalfilesystemusing'file://'becauseitdefaultstohdfs://df.coalesce(1).rdd.s

hadoop - 了解 Spark : Cluster Manager, Master 和 Driver 节点

读完这篇question,我想再问一些问题:集群管理器是一个长期运行的服务,它在哪个节点上运行?主节点和驱动节点可能是同一台机器吗?我假设某处应该有一条规则说明这两个节点应该不同?如果Driver节点出现故障,谁负责重新启动应用程序?究竟会发生什么?即主节点、集群管理器和工作节点将如何参与(如果他们参与),以及以什么顺序参与?与上一个问题类似:如果主节点发生故障,具体会发生什么情况以及谁负责从故障中恢复? 最佳答案 1.TheClusterManagerisalong-runningservice,onwhichnodeitisru

hadoop - Hadoop 中的拆分大小与 block 大小

Hadoop中分割大小和block大小之间的关系是什么?正如我在this中读到的那样,拆分大小必须是block大小的n倍(n是一个整数且n>0),这是正确的吗?splitsize和blocksize之间有什么必然的关系吗? 最佳答案 HDFS架构中有block的概念。HDFS使用的典型block大小为64MB。当我们将一个大文件放入HDFS时,它被分成64MB的block(基于block的默认配置),假设你有一个1GB的文件并且你想将该文件放入HDFS,那么将有1GB/64MB=16个拆分/block,这些block将分布在Data

scala - Spark : check your cluster UI to ensure that workers are registered

我在Spark中有一个简单的程序:/*SimpleApp.scala*/importorg.apache.spark.SparkContextimportorg.apache.spark.SparkContext._importorg.apache.spark.SparkConfobjectSimpleApp{defmain(args:Array[String]){valconf=newSparkConf().setMaster("spark://10.250.7.117:7077").setAppName("SimpleApplication").set("spark.cores.m

hadoop - 为什么 HDFS 中的 block 这么大?

有人可以解释这个计算并给出清晰的解释吗?Aquickcalculationshowsthatiftheseektimeisaround10msandthetransferrateis100MB/s,tomaketheseektime1%ofthetransfertime,weneedtomaketheblocksizearound100MB.Thedefaultisactually64MB,althoughmanyHDFSinstallationsuse128MBblocks.Thisfigurewillcontinuetoberevisedupwardastransferspeeds

hadoop - 查看hadoop中文件的 block 数

在Hadoop文件系统中,如何查看一个文件被分成了多少block? 最佳答案 我们可以使用hadoop文件系统检查命令来了解特定文件的block。命令如下:hadoopfsck[path][options]查看特定文件的block:hadoopfsck/path/to/file-files-blocks 关于hadoop-查看hadoop中文件的block数,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.c

Hadoop 输入拆分大小与 block 大小

我正在阅读hadoop权威指南,其中清楚地解释了输入拆分。就像Inputsplitsdoesn’tcontainactualdata,ratherithasthestoragelocationstodataonHDFS和Usually,SizeofInputsplitissameasblocksize1)假设一个64MB的block在节点A上并在其他2个节点(B、C)之间复制,并且map-reduce程序的输入分割大小为64MB,这个分割会吗只有节点A的位置?或者它是否具有所有三个节点A、b、C的位置?2)由于数据对于所有三个节点都是本地的,因此框架如何决定(选择)一个maptask在

php - Magento:静态 block 和配置设置迁移

为了将所有更改迁移到所有环境,我使用了数据库升级脚本。我使用它们来创建不同的实例(客户、税务设置等),但通常用于迁移静态block和配置设置。迁移静态block:'Blocktitle','identifier'=>'block_identifier','content'=>'blockcontent','is_active'=>1,'stores'=>array(0=>Mage_Core_Model_App::ADMIN_STORE_ID),);$block->addData($data);$block->save();?>迁移设置:saveConfig('design/theme/