草庐IT

configuring-authentication-handle

全部标签

python - 为什么 Windows7 中的 hadoop 会引发 RuntimeException : Error in configuring object

我试图在windows7中以伪分布式模式运行hadoop程序,但出现了RuntimeException。我不知道为什么以及如何解决它。我使用python进行mapreduce工作,而不是使用hadoop-streaming实用程序(https://hadoop.apache.org/docs/current/hadoop-streaming/HadoopStreaming.html)的java。我运行了hadoopjar%HADOOP_HOME%\share\hadoop\tools\lib\hadoop-streaming-2.6.2.jar-mappermapper.py-redu

Could not resolve all files for configuration ‘:app:androidJdkImage‘.

在使用./gradlewbuild编译项目时候遇到了该问题,整体错误如下:*Whatwentwrong:Configurationcachestatecouldnotbecached:field`generatedModuleFile`of`com.android.build.gradle.tasks.JdkImageInput`beanfoundinfield`compilerArgumentProviders`of`org.gradle.api.tasks.compile.CompileOptions`beanfoundinfield`capturedArgs`of`java.lang.i

csv - 最佳实践 : how to handle data records with changing "schema"/ "columns"

这是一个最佳实践问题。我们的设置是一个hadoop集群,将(日志)数据存储在hdfs中。我们获取csv格式的数据,每天一个文件。在hadoop中对这些文件运行MR作业没问题,只要文件的“架构”(尤其是列数)不变即可。但是,我们面临的问题是,我们要分析的日志记录最终会发生变化,因为可能会添加或删除列。我想知道你们中的一些人是否愿意分享针对此类情况的最佳实践。我们目前能想到的最好的方式是将数据存储为json格式而不是csv。但是,这会增加(至少增加一倍)所需的存储空间。我们还遇到了ApacheAvro和ApacheParquet,并且刚刚开始对此进行研究。欢迎就此问题提出任何想法和意见。

hadoop - java.io.IOException : org. apache.hadoop.security.AccessControlException : Client cannot authenticate via:[TOKEN, KERBEROS]

我的配置如下:运行Spark1.2.0,Hadoop2.5.0/YARN,ClouderaCDH5VMCentos6.2运行Windows64位平台8GBRAM下面是从spark-shell运行的命令序列,但在尝试打印custRDD时,我收到Kerberos身份验证错误。我已经从cloudera用户登录到spark-shell,ClouderaVM是Kerberos认证的,默认主体是cloudera@HADOOP.LOCALDOMAIN对于正常的RDD操作,有什么方法可以从spark-shell验证Kerberos吗?或者我遗漏了什么?感谢任何正当的帮助,将得到返回下面是SparkSh

hadoop - 加入 : space available is below the configured reserved amount 的配置单元查询

我在单节点集群上使用hive执行sql查询,我收到此错误:MapReduceJobsLaunched:Stage-Stage-20:HDFSRead:4456448HDFSWrite:0FAILTotalMapReduceCPUTimeSpent:0msec在日志http://localhost:50070/logs/hadoop-hadoop-namenode-hadoop.log中,可用空间似乎低于配置的保留量:org.apache.hadoop.hdfs.server.namenode.NameNodeResourceChecker:Spaceavailableonvolume'

apache-spark - Spark 独立集群 :Configuring Distributed File System

我刚刚从Spark本地设置迁移到Spark独立集群。显然,加载和保存文件不再有效。我了解我需要使用Hadoop来保存和加载文件。我的Spark安装是spark-2.2.1-bin-hadoop2.7问题1:我仍然需要单独下载、安装和配置Hadoop以与我的独立Spark集群一起工作,我是否正确?问题2:使用Hadoop运行和使用Yarn运行有什么区别?...哪个更容易安装和配置(假设数据负载相当轻)? 最佳答案 A1。正确的。你提到的包只是打包了指定版本的hadoop客户端,如果你想使用hdfs,你仍然需要安装hadoop。A2。使

configuration - Hadoop Configuration.addDefaultResource() 不工作

我的以下代码没有产生预期的输出:publicstaticvoidmain(String[]args)throwsMalformedURLException{Configuration.addDefaultResource("/home/some_user/conf.xml");Configurationconf=newConfiguration();System.out.println(conf);System.out.println(conf.get("color"));assertThat(conf.get("color"),is("yellow"));}属性color在conf.

java - 在Configuration中设置HDFS的根目录

我有一个目录结构:/DIRfilesDIRusr我的HDFS在hdfs://db:123可用,所以我创建配置:configuration.set("fs.default.name","hdfs://db:123");那么所有的目录/路径都是相对于根的(/)。我创建了一个目录files,这是我想要保存所有文件的地方。我是否必须手动将/files/附加到代码中每个路径的开头,或者我是否可以创建配置:configuration.set("fs.default.name","hdfs://db:123/files");无需更改代码? 最佳答案

hadoop - 运行时异常 : Error in configuring object with null pointer exception while running my UDAF?

我一直在尝试编写一个UDAF来计算加权平均值。我用类似于现有UDAF的方式编写它来计算平均值,但它似乎只适用于我的本地机器。我不确定出了什么问题....有人遇到过类似的问题吗以下是生成的错误:java.lang.RuntimeException:Errorinconfiguringobjectatorg.apache.hadoop.util.ReflectionUtils.setJobConf(ReflectionUtils.java:93)atorg.apache.hadoop.util.ReflectionUtils.setConf(ReflectionUtils.java:64)

java - 将 hadoop 的 Configuration 转换为 Map<String, String>

如何转换hadoop的Configurationconf至Map?我有一个将Map作为参数的方法,我想将Configurationconf传递给它,那么如何在两者之间转换? 最佳答案 您可以使用Configuration提供的迭代器并构建map。Configurationconfiguration=newConfiguration();Mapmap=newHashMap();Iterator>iterator=configuration.iterator();while(iterator.hasNext()){Map.Entryen