service_name

amazon-web-services - 使用 Scala 读取 .aws/credentials 文件以获取来自 spark 的 hadoop conf 设置

我如何才能读取位于.aws目录下的credentials文件中的不同aws配置文件？只想让我的应用程序读取访问key和secret，如下所示，但不确定如何将这一点指向凭证文件。objectS3KeyStoreextendsSerializable{privatevalkeyMap=Map(String,S3Key)defload(key:String)(implicitsc:SparkContext)=keyMap.get(key)match{caseSome(k)=>valhc=sc.hadoopConfigurationhc.set("fs.s3a.awsAccessKeyId",

amazon-web-services credentials section 中设凭据 hadoop apache-spark amazon-s3

maven - org.datanucleus.exceptions.NucleusUserException : Error : Could not find API definition for name "JDO"

我试图通过hcatalog访问mapreduce中的配置单元表并面临以下异常:我用谷歌搜索并试图找到根本原因，但没有成功，所以我在这里发布我的查询。2016-12-0115:48:35,855INFO[main]metastore.HiveMetaStore(HiveMetaStore.java:newRawStore(564))-0:Openingrawstorewithimplementationclass:org.apache.hadoop.hive.metastore.ObjectStore2016-12-0115:48:35,857INFO[main]metastore.Ob

NucleusUserException datanucleus gt lt artifactId maven hadoop hive hcatalog

linux - 安装和获取当前的 dfs.name.dir 和 dfs.data.dir 值

我没有在hdfs-site.xml文件中设置dfs.name.dir和dfs.data.dir值没有设置。他们会怎样？有趣的是，他们默认接受什么值？(如何接收他们的当前值？) 最佳答案 dfs.name.dir的默认值为${hadoop.tmp.dir}/dfs/data和dfs.data.dir是${hadoop.tmp.dir}/dfs/data。如果hadoop.tmp.dir的值未使用-D选项或配置文件设置，则默认值为/tmp/hadoop-${user.name}user.name是您用来登录系统的用户名。对于所有默认值，

dfs dir code section hadoop linux configuration settings hdfs

java - 无法在 Oozie java 操作中设置 mapred.job.queue.name

我有一个运行紧迫作业的应用程序。我正在尝试将Oozie配置为使用Java操作运行此作业。我的操作如下，${jobTracker}${nameNode}mapred.job.queue.namelaunchercom.test.Main-Dmapred.output.compress=false-Dmapred.textoutputformat.separator=,-Dcrunch.disable.output.counters=trueActionfailed,errormessage[${wf:errorMessage(wf:lastErrorNode())}]但每次我运行Oozi

中设 java lt gt name hadoop oozie oozie-coordinator apache-crunch

python - 导入错误 : No module named impyla

我已经安装了impyla及其依赖项this指导。安装似乎是成功的，因为现在我可以在Anaconda文件夹(64位Anaconda4.1.1版本)中看到文件夹"impyla-0.13.8-py2.7.egg"。但是当我在python中导入impyla时，出现以下错误:>>>importimpylaTraceback(mostrecentcalllast):File"",line1,inImportError:Nomodulenamedimpyla我已经安装了64位Python2.7.12任何人都可以解释我为什么会遇到这个错误吗？我是Python的新手并且一直在不同的博客上花费大量时间，但

python module impyla section cursor hadoop thrift impala

hadoop - 当 Name Node 在 YARN 中失败时，工作状态是什么？

当一个job在集群中运行时，如果NameNode突然挂了，那么这个job的状态是什么(failed或者killed)？如果失败意味着谁在更新作业状态？这在内部是如何工作的？最佳答案备用Namenode将通过故障转移过程变为事件Namenode。看看HowdoesHadoopNamenodefailoverprocessworks?YARN架构围绕着ResourceManager、NodeManager和ApplicationsMaster。作业将继续进行，而不会因名称节点故障而受到任何影响。如果以上三个进程中的任何一个失败，将根

hadoop Name strong section noreferrer hdfs hadoop-yarn hadoop2

java - 连接到 Kerberrized HDFS，java.lang.IllegalArgumentException : Failed to specify server's Kerberos principal name;

我正在尝试使用以下代码连接到Kerberizedhdfs集群，使用以下相同的代码我能够使用HBaseConfiguration访问hbaseofcourse，Configurationconfig=newConfiguration();config.set("hadoop.security.authentication","Kerberos");UserGroupInformation.setConfiguration(config);UserGroupInformationugi=null;ugi=UserGroupInformation.loginUserFromKeytabAnd

IllegalArgumentException java hadoop apache kerberos cloudera keytab

web-services - 将 Spark RDD 上传到 REST webservice POST 方法

坦率地说，我不确定这个功能是否存在？抱歉我的要求是每天将spark分析数据发送到文件服务器，文件服务器支持通过SFTP和RESTWebservicepost调用进行文件传输。最初的想法是将SparkRDD保存到HDFS，通过SFTP传输到文件服务器。我想知道是否可以通过从spark驱动程序类调用REST服务直接上传RDD而无需保存到HDFS。数据大小小于2MB抱歉我的英语不好! 最佳答案 Spark没有特定的方法来做到这一点。对于这种数据大小，通过HDFS或其他类型的存储是不值得的。您可以在驱动程序的内存中收集该数据并直接发送。对于

传到 web-services section http noreferrer scala rest hadoop apache-spark

hadoop - Service Monitor 在 HBase 服务中没有找到活跃的 Master

我用clouderaCDH5.8.0做了一个主节点和三个从节点的集群。经过一些配置工作后，我的所有服务都正常运行，但只有一个:HBase。重新启动后几分钟，它的健康状况不佳。ClouderaManager显示的错误是:“错误:Master摘要:此健康测试错误，因为服务监视器未找到事件的Master”。我检查了服务监视器日志，发现了这个警告:(7skipped)ExceptionindoWorkfortask:hbase_HBASE_SERVICE_STATE_TASKorg.apache.hadoop.hbase.client.RetriesExhaustedException:Fai

Service Monitor java hadoop hbase cloudera cloudera-cdh cloudera-manager

hadoop - YARN Timeline Service v2 无法启动

我在AWS上设置了一个测试HDP集群，用于评估一个项目。AmbariUI报告了一些错误，当我根据需要重新启动服务时，我遇到了YARN的问题。为YARN启动TimelineServiceReaderV2时，出现错误2018-08-1015:51:06,400INFO[main]client.RpcRetryingCallerImpl:Callexception,tries=15,retries=15,started=129034msago,cancelled=false,msg=CalltoHOSTNAME/IPADDRESS:17020failedonconnectionexcepti

Timeline Service ambari-agent resource_management ambari hadoop hbase hadoop-yarn

103 104 105106107 108 109