草庐IT

key-management

全部标签

hadoop - GPG key 检索失败 Hadoop Bigtop 安装

按照以下站点中的说明-(http://www.dummies.com/how-to/content/set-up-the-hadoop-environment-with-apache-bigtop.html)或更确切地说来自HadoopforDummies一书。第3步成功运行到最后,总下载大小为616MB,但在最后我遇到了这个错误-Total130kB/s|616MB80:52warning:rpmts_HdrFromFdno:HeaderV4RSA/SHA1Signature,keyIDfa08b173:NOKEYRetrievingkeyfromhttps://dist.apach

Hadoop: `hdfs getconf -confKey [key]` 有哪些关键参数可用?

在不熟悉的集群上工作时,我发现深入研究和检查一些基本配置参数很有用(例如hdfsgetconf-confKeyfs.blocksize、hdfsgetconf-confKeyfs.defaultFs)。还有哪些可用的key参数?我正在寻找最全面的key参数文档,可通过检查hdfsgetconf-confKey[key].我知道某些key集将特定于您的集群(例如,您是否可以使用Yarn以及是否有可用的yarn.resourcemanager.address)。 最佳答案 所有的属性名都可以作为键。对于属性名称列表,您可以引用*-def

azure - 如何保护 Azure Key Vault 中的 blob 存储访问 key

我们希望在key保管库中保护AzureBlob存储访问key。哪个版本https://mvnrepository.com/artifact/org.apache.hadoop/hadoop-azure支持这种功能,因为当前的支持并不那么安全。http://hadoop.apache.org/docs/stable/hadoop-azure/index.html使用AzureBlob存储需要配置凭据。通常这是在core-site.xml中设置的。配置属性名称的格式为fs.azure.account.key..blob.core.windows.net,值为访问key。访问key是保护对存

hadoop streaming 确保每个 reducer 一个 key

我有一个映射器,它在处理数据时将输出分为3种不同的类型(类型是输出键)。我的目标是通过reducer创建3个不同的csv文件,每个文件都包含一个带有标题行的键的所有数据。键值可以改变并且是文本字符串。现在,理想情况下,我想要3个不同的reducer,每个reducer只会获得一个键及其整个值列表。除了,这似乎不起作用,因为键没有映射到特定的reducer。在其他地方对此的答案是编写一个自定义分区器类,将每个所需的键值映射到特定的缩减器。这会很棒,除了我需要使用python流式传输并且我无法在我的工作中包含自定义流式传输jar,所以这似乎不是一个选项。我看到inthehadoopdocs

java - Apache Spark : TaskResultLost (result lost from block manager) Error On cluster

我在Virtualbox上有一个带有3个从节点的Spark独立集群。我的代码在Java上,它可以很好地处理我的小输入数据集,它们的输入总共大约100MB。我将我的虚拟机RAM设置为16GB,但是当我在大输入文件(大约2GB)上运行我的代码时,在我的reduce部分处理数小时后出现此错误:Jobabortedduetostagefailure:Totalsizeofserializedresultsof4tasks(4.3GB)isbiggerthanspark.driver.maxResultSize`我编辑了spark-defaults.conf并为spark.driver.maxR

hadoop - Cloudera Manager 安装无法从代理接收心跳 - 将新主机添加到集群

我尝试在Ubuntu12.04.1LTS上安装使用标准版本的cloudera管理器,当我想添加新主机时,出现下一个错误:Installationfailed.Failedtoreceiveheartbeatfromagent.Ensurethatthehost'shostnameisconfiguredproperly.Ensurethatport7182isaccesibleontheClouderaManagerserver(checkfirewallrules).Ensurethatports9000an9001arefreeonthehostbeingadded.Checkag

scala - Spark : Custom key compare method for reduceByKey

我需要在Scala中使用我自己的类作为键/值对中的键。特别是,我有一个包含两个变量id1和id2的简单类,我希望元素仅根据id2和不是id1。我在网上找不到任何关于如何以及在何处可以重写reduceByKey()方法的比较方法的信息,以便它可以根据我的自定义compare()方法。感谢任何帮助。谢谢你。 最佳答案 您不能覆盖reduceByKey的比较,因为它无法利用这样一个事实,即您的数据通常在整个集群中的不同执行程序上按key进行混洗。不过,您可以更改key(请注意,根据您使用的转换/操作,这可能会重新洗牌周围的数据)。RDD中

security - 什么是 key 表?

我试图了解Kerberos的工作原理,因此遇到了这个名为Keytab的文件,我相信它用于对KDC服务器进行身份验证。就像Kerberos领域中的每个用户和服务(比如Hadoop)都有一个服务主体一样,是否每个用户和服务都有一个key表文件?此外,使用keytab的身份验证是否适用于对称key加密或公私key? 最佳答案 要回答您的两个问题,每个用户和服务都不需要key表文件,key表使用对称key加密。我将根据我对如何在使用ActiveDirectory作为目录服务的Windows和非Windows系统的混合网络中使用key表的理解

hadoop - 了解 Spark : Cluster Manager, Master 和 Driver 节点

读完这篇question,我想再问一些问题:集群管理器是一个长期运行的服务,它在哪个节点上运行?主节点和驱动节点可能是同一台机器吗?我假设某处应该有一条规则说明这两个节点应该不同?如果Driver节点出现故障,谁负责重新启动应用程序?究竟会发生什么?即主节点、集群管理器和工作节点将如何参与(如果他们参与),以及以什么顺序参与?与上一个问题类似:如果主节点发生故障,具体会发生什么情况以及谁负责从故障中恢复? 最佳答案 1.TheClusterManagerisalong-runningservice,onwhichnodeitisru

Blockchain for Internet of Energy management: Review, solutions, and challenges

本文是《BlockchainforInternetofEnergymanagement:Review,solutions,andchallenges》的中文翻译,只针对文字部分做翻译,图表部分请查看原文。能源管理互联网的区块链:回顾、解决方案和挑战摘要1.引言1.1本文的贡献1.2相关综述文章的回顾1.3组织2.能源互联网概述2.1能源互联网介绍2.2能源互联网的问题3.区块链在IoE中的适用性3.1区块链的基础3.2区块链在IoE中的应用4.共识算法4.0.1工作量证明(PoW)4.0.2股权证明(PoS)4.0.3委托股权证明(DPoS)4.0.4实用拜占庭容错(PBFT)4.0.5授权证