token_storage

hadoop - 未经授权的容器启动请求。此 token 已过期

我收到“启动容器的未经授权的请求。此token已过期。”如何解决它。这个问题在不同的论坛上都有报道，但我找不到解决方案。下面是执行日志15/02/2616:41:02INFOimpl.YarnClientImpl:Submittedapplicationapplication_1424968835929_000115/02/2616:41:02INFOmapreduce.Job:Theurltotrackthejob:http://101-master15:8088/proxy/application_1424968835929_0001/15/02/2616:41:02INFOmap

容器未经 java 1424968835929 section hadoop containers hadoop-yarn

hadoop - master.HMaster : Failed to become active master SIMPLE authentication is not enabled. 可用:[TOKEN]

我正在尝试在我的本地MAC机器上设置hbase。我通过brew安装了hadoop和hbase。hadoop和hbase的版本分别是2.7.1和1.1.2。我正在尝试以伪分布式模式运行并希望禁用身份验证，因此在以下文件中进行了以下更改。我正在使用hbase动物园管理员。以下是启用SIMPLE身份验证的更改/etc/hadoop/core-site.xmlhadoop.security.authenticationsimplehadoop.security.authorizationfalse还对libexec/conf/hbase-site.xml进行了以下更改hbase.rootdir

master authentication hadoop java gt hbase

hadoop - 错误 : Failed to create Data Storage while running embedded pig in java

我写了一个简单的程序来测试java中的嵌入式pig在mapreduce模式下运行。我运行的服务器hadoop版本是0.20.2-cdh3u4a，pig版本是0.10.0-cdh3u4a。当我尝试在本地模式下运行时，它运行成功。但是当我尝试以mapreduce模式运行时，它给了我错误。我使用以下命令运行我的程序，如http://pig.apache.org/docs/r0.9.1/cont.html#embed-java中所示javac-cppig.jarEmbedPigTest.javajavac-cppig.jar:.:/etc/hadoop/confEmbedPigTest.jav

embedded Storage java pig apache hadoop apache-pig

hadoop - Spark 1.6.Token只能通过kerberos或web认证方式下发

我在shell驱动程序脚本中的spark-submit之前调用了kinitkeytab。问题是，它自己工作，但是当我通过Oozie调用shell驱动程序脚本时，我得到了这个错误:Stdoutputpy4j.protocol.Py4JJavaError:Anerroroccurredwhilecallingo49.saveAsTextFile.Stdoutput:org.apache.hadoop.ipc.RemoteException(java.io.IOException):DelegationTokencanbeissuedonlywithkerberosorwebauthenti

下发 kerberos section keytab code hadoop apache-spark gssapi

hadoop - 即使在向命令行添加原则后，HDFS 委托(delegate) token 也已过期

我在hadoop中运行一个sparkstreaming作业。该机器已进行kerberos化，它运行良好42小时，但由于HDFStoken委托(delegate)到期而失败。我什至为每8小时运行一次的kinit命令设置了crontab，并且我拥有10小时的Max-renew生命周期token。Failedduetoerror:org.apache.hadoop.ipc.RemoteException(org.apache.hadoop.security.token.SecretManager$InvalidToken):token(HDFS_DELEGATION_TOKENtoken我还

delegate 即使 section token blockquote hadoop spark-streaming kerberos kerberos-delegation

hadoop - 在缓存中找不到 Hdfs 委托(delegate) token - Spark 应用程序出错

我在Spark版本2.3.0中有一个简单的SparkStreaming应用程序，它将每个处理批处理的结果放在HDFS上。我的应用程序在部署模式客户端的YARN上运行，我正在使用kerberizedhadoop集群(hadoop2.6.0-cdh5.9.3)。我在spark-submit命令中设置了--principal和--keytab。几天后，由于缓存中缺少委托(delegate)token，我的应用程序无法写入HDFS。重新启动应用程序后，流媒体工作正常，但几天后由于同样的原因再次失败。这是来自驱动程序的日志:ERRORJobScheduler:Errorrunningjobstr

delegate hadoop section token hdfs spark-streaming hadoop-yarn kerberos

hadoop - 客户端无法通过 :[TOKEN, KERBEROS 进行身份验证]

我正在使用YarnClient以编程方式开始一项工作。我正在运行的集群已经过kerberos化。法线贴图减少通过“yarnjarexamples.jarwordcount...”提交的工作。我尝试以编程方式提交的作业没有。我收到此错误:14/09/0421:14:29ERRORclient.ClientService:Errorhappenedduringapplicationsubmit:Applicationapplication_1409863263326_0002failed2timesduetoAMContainerforappattempt_1409863263326_00

KERBEROS hadoop section yarnClient ClientService cloudera hadoop-yarn kerberos-delegation

java - Hadoop datanode 启动失败 org.apache.hadoop.hdfs.server.common.Storage : Cannot lock storage

我在尝试在Hadoop中启动数据节点时遇到一些问题，从日志中我可以看到数据节点启动了两次(部分日志如下):2012-05-2216:25:00,369INFOorg.apache.hadoop.hdfs.server.datanode.DataNode:STARTUP_MSG:/************************************************************STARTUP_MSG:StartingDataNodeSTARTUP_MSG:host=master/192.168.0.1STARTUP_MSG:args=[]STARTUP_MSG:ve

datanode Storage hadoop apache java locking hdfs ubuntu-12.04

storage - 实现大规模日志文件分析

谁能给我指点引用或提供有关Facebook、雅虎、谷歌等公司如何执行大规模(例如多TB范围)日志分析的引用资料或高级概述，这些分析是他们为运营所做的，尤其是网络分析？特别关注网络分析，我对两个密切相关的方面很感兴趣:查询性能和数据存储。我知道一般方法是使用mapreduce将每个查询分布到集群上(例如使用Hadoop)。但是，最有效的存储格式是什么？这是日志数据，所以我们可以假设每个事件都有一个时间戳，并且通常数据是结构化的而不是稀疏的。大多数网络分析查询涉及分析两个任意时间戳之间的数据片段，并检索该数据中的聚合统计信息或异常情况。像BigTable(或HBase)这样的面向列的数据库

大规 storage section 的 hadoop mapreduce bigtable

authentication - 从 Spark 访问 Hdfs 会出现 token 缓存错误 Can't get Master Kerberos principal for use as renewer

我正在尝试运行测试Spark脚本以将Spark连接到hadoop。脚本如下frompysparkimportSparkContextsc=SparkContext("local","SimpleApp")file=sc.textFile("hdfs://hadoop_node.place:9000/errs.txt")errors=file.filter(lambdaline:"ERROR"inline)errors.count()当我用pyspark运行它时，我得到了py4j.protocol.Py4JJavaError:Anerroroccurredwhilecallingo21.

authentication principal hadoop apache scala kerberos apache-spark

223 224 225226227 228 229