USER_NAME_草庐IT

hadoop - HDFS 加密 : User:hdfs not allowed to do 'DECRYPT_EEK' on 'hdfskey'

我正在尝试在HDP2.4上使用RangerKMS设置HDFS加密。我能够部署和配置KMS服务。我已经创建了一个key和一个访问策略，以授予hdfs用户使用此key进行操作的所有权限。我可以创建一个加密区域sudo-uhdfshdfsmkdir/data_encsudo-uhdfshdfscrypto-createZone-keyNamehdfskey-path/data_enc但是，当我尝试将文件放入目录时，出现此错误:sudo-uhdfshdfsdfs-put/tmp/file.txt/data_enc/...User:hdfsnotallowedtodo'DECRYPT_EEK'o

amp 39 code section DECRYPT_EEK hadoop encryption hdfs hortonworks-data-platform apache-ranger

hadoop - 文件夹不是用 $HADOOP_HOME/bin/hadoop fs -mkdir/user/hive/warehouse 创建的

嘿，我正在Hadoop2.7.3单节点集群中安装HIVE，但我无法使用创建文件夹$HADOOP_HOME/bin/hadoopfs-mkdir/user/hive/warehouse16/11/1114:43:25WARNutil.NativeCodeLoader:Unabletoloadnative-hadooplibraryforyourplatform...usingbuiltin-javaclasseswhereapplicablemkdir:`/user/hive/warehouse':NosuchfileordirectoryHadoop的JPS运行良好:jps15411N

hadoop HADOOP_HOME section warehouse configuration installation hive

java - 无法初始化集群。请检查您的配置中的 mapreduce.framework.name 和相应的服务器地址

我正在尝试运行相同的代码(org.apache.hadoop.hbase.mapreduce.Export)导出类，方法是将所有必需的jar从java命令行路径(./java-cp“。:/npachava/*"Exporttest/test)，我收到以下错误。Exceptioninthread"main"java.io.IOException:CannotinitializeCluster.Pleasecheckyourconfigurationformapreduce.framework.nameandthecorrespondserveraddresses.atorg.apache

framework mapreduce hadoop java hbase

hadoop - spark-submit 如何设置user.name

要设置mapreduce.job.user.name=myuser尝试过spark-submit--classcom.MyClass--confmapreduce.job.user.name=myuser\--confspark.mapreduce.job.user.name=myuser\--masteryarn\--deploy-modecluster\也试过--confuser.name在SparkUI环境中显示user.nameyarn 最佳答案在Spark3中，将SPARK_USER设置为系统属性。https://git

spark-submit hadoop section code spark apache-spark hadoop2

hadoop - Hive:无法在具有 100 个或更多分区列的表中插入数据错误:在最大长度为 767 的列 "PART_NAME"中

我正在使用配置单元，我需要创建一个包含“n”个普通列和100个或更多作为分区列的表，并且我能够成功创建该表。现在当我用另一个具有相同模式的表的数据加载该表并且所有列都是非分区列时，我收到这样的错误:FailedwithexceptionMetaException(message:AttempttostorevalueFailedwithexceptionMetaException(message:Attempttostorevalue"c1=v1/c2=v2/c3=v3/....c100=v100"incolumn"PART_NAME"thathasmaximumlengthof767

amp PART_NAME strong blockquote section hadoop hive cloudera

Hadoop mapreduce 出现 "Cannot resolve the host name"错误

现在运行Hadoopmapreduce作业，输入数据来自HBase表，最近出现错误，错误如下:错误mapreduce.TableInputFormatBase:无法解析/172.16.4.195的主机名，因为javax.naming.NameNotFoundException:找不到DNS名称[响应代码3]；剩余名称'195.4.16.172.in-addr.arpa'*172.16.4.195*是集群节点(slave)ip地址，我不知道“195.4.16.172”是什么。我第一次运行这个job的时候没有这个错误，不知道为什么会出现这个错误。如果你解决了问题，请告诉我，谢谢。

mapreduce amp section strong hadoop

hadoop - Name node在哪里存储fsImage和edit Log？

我是一名java程序员，正在学习Hadoop。我读到HDFS中的名称节点将其信息存储到两个文件中，即fsImage和editLog。在启动的情况下，它会从磁盘读取此数据并执行检查点操作。但在很多地方我也读到NameNode将数据存储在RAM中，这就是为什么apache推荐具有高RAM的机器作为NameNode服务器。请赐教。它在RAM中存储什么数据？它在哪里存储fsImage和编辑日志？抱歉，如果我问了一些显而易见的问题。最佳答案我先回答WhatdatadoesitstoreinRAM&wheredoesitstorefsIma

fsImage hadoop section RAM hdfs

user-interface - 任务进度条的 Spark UI 浅蓝色部分表示什么？

下面是ApacheSparkUI的屏幕截图，显示了阶段0的进度。在“任务”列下，进度条有深蓝色和浅蓝色部分。深蓝色部分对应的是已经成功完成的任务数【下面截图中的1075/3200】。进度条的浅蓝色部分表示什么？谢谢! 最佳答案条形的总大小表示给定阶段的任务数量深蓝色部分代表已经完成的任务条形的浅蓝色部分代表当前正在运行的任务关于user-interface-任务进度条的SparkUI浅蓝色部分表示什么？，我们在StackOverflow上找到一个类似的问题：

user-interface interface section strong 条形 hadoop apache-spark

hadoop - Name Node 存储什么？

在“名称节点”的情况下，什么存储在主内存中，什么存储在辅助内存(硬盘)中。“文件到block的映射”是什么意思？fsimage和编辑日志到底是什么？最佳答案 Incaseof"NameNode",whatgetsstoredinmainmemoryandwhatgetsstoredinsecondarymemory(harddisk).block映射文件、block在数据节点上的位置、事件数据节点、一堆其他元数据都存储在NameNode的内存中。当您查看NameNode状态网站时，几乎所有这些信息都存储在某个地方的内存中。唯一存储

hadoop Name code fsimage NameNode mapreduce hdfs bigdata

hadoop - 在 core-site.xml 中设置 fs.default.name 将 HDFS 设置为安全模式

我在一台机器上以伪分布式模式安装了ClouderaCDH4发行版并成功测试它是否正常工作(例如可以运行MapReduce程序，在Hive服务器上插入数据等)但是，如果我有机会core-site.xml文件将fs.default.name设置为机器名而不是localhost并重启NameNode服务，HDFS进入安全-模式。在更改fs.default.name之前，我运行了以下命令来检查HDFS的状态:$hadoopdfsadmin-report...ConfiguredCapacity:18503614464(17.23GB)PresentCapacity:13794557952(12

中设 core-site code hadoop section hdfs cloudera