草庐IT

ADMIN_ONLY_OPERATION

全部标签

hadoop - 遍历 reducer 中的 IntWritable 数组给出 "Can only iterate over an array or an instance of java.lang.Iterable"

我已经编写了一个Driver、Mapper和Reducer程序来尝试复合键(输入数据集中的多个字段)。数据集如下所示:国家、州、县、人口(百万)美国,加利福尼亚州,阿拉米达,12美国,加利福尼亚州,圣克拉拉,14美国,亚利桑那州,阿巴吉德,14我正在尝试找出国家/地区的总人口。因此,reducer应该聚合两个字段Country+State并显示人口。当我在步骤(在reducer代码中)遍历population时for(IntWritablei:values)我收到编译器错误“Canonlyiterateoveranarrayoraninstanceofjava.lang.Iterabl

hadoop - "Delegation Token can be issued only with kerberos or web authentication"空闲后重启 spark context

我尝试将spark应用程序部署到由YARN控制的kerberizedhadoop集群。Spark版本为1.5.0-cdh5.5.2。在超过10秒的空闲时间后停止SparkContext并初始化一个新的时,我遇到了一个奇怪的异常。我尝试做一些类似于this的事情开发人员,并明确指定了hdfs名称节点地址,但没有帮助。更令人困惑的是,如果我根本不重置SparkContext或在此spark上下文中执行最后一个命令后不到10秒内重置它,一切都会正常工作。我该如何解决?这是遇到问题的最小化情况:packagedemo;importorg.apache.spark.SparkConf;impor

hadoop - Oozie 简单 ssh 作业失败 : AUTH_FAILED: Not able to perform operation

我正在尝试使用Clouderaoozie进行简单的ssh作业。job.properties:nameNode=hdfs://localhost:8020jobTracker=localhost:8032queueName=defaultexamplesRoot=examplesoozie.wf.application.path=${nameNode}/user/${user.name}/${examplesRoot}/apps/sshworkflow.xml:localhostdateSSHactionfailed,errormessage[${wf:errorMessage(wf:l

Python HDFS 蛇咬伤 : Methods work only with print

我正在使用snakebite客户端https://github.com/spotify/snakebite当我尝试在hdfs中创建目录或移动文件时,我注意到一个奇怪的行为。这是我的代码。它所做的只是将源目录的内容移动到目标目录。最后,显示目标目录的内容defpurge_pending(self,source_dir,dest_dir):if(self.hdfs_serpent.test(path=self.root_dir+"/"+source_dir,exists=True,directory=True)):print"Sourceexists",self.root_dir+sour

redisson Unexpected exception while processing command Only 1 of 2 slaves were synced

目录背景:现象:问题定位:问题原因:解决:背景:生产环境一个活动给某个用户发送积分失败,核心业务接口使用Redisson分布式锁同事答复:redis主从切换导致的问题。个人表示怀疑,所以想定位下真实原因。redisson3.17.3sentinel模式:masterslave1slave2           org.redisson        redisson-spring-boot-starter        3.17.3   RLockrLock=redisson.getLock("xxxxxx");rLock.lock(15,TimeUnit.SECONDS);现象:rLock.

hadoop - 如何修复 "File could only be replicated to 0 nodes instead of minReplication (=1)."?

Iaskedasimilarquestionawhileago,并认为我解决了这个问题,但事实证明它消失了只是因为我正在处理一个较小的数据集。很多人问过这个问题,我已经遍历了所有我能找到的互联网帖子,但仍然没有取得任何进展。我想做的是:我在配置单元中有一个外部表browserdata,它引用了大约1GB的数据。我尝试将该数据粘贴到分区表partbrowserdata中,其定义如下:CREATEEXTERNALTABLEIFNOTEXISTSpartbrowserdata(BidIDstring,Timestamp_string,iPinYouIDstring,UserAgentstri

'npm install -only = dev'删除现有软件包

在从事节点项目时,我在使用应用程序和测试依赖项的安装时遇到了麻烦NPM。我正在使用节点版本8.1.2和NPM版本5.0.3.为了详细说明,我正在使用Docker创建生产和测试我的节点应用程序的图像,并以这样的想法生产图像将仅安装应用程序依赖项(例如AWS-SDK,XML构建器)。我正在跑步npminstall-q--only=prod在里面生产Docker图像。这测试图像扩展了生产图像并在其顶部安装测试依赖项(例如柴,摩卡)。这是通过运行来实现的npminstall-q--only=dev命令测试Docker图像。这项练习的目的是创建一个干净生产没有不必要的软件包的图像。但是当我执行后者时NP

hadoop - Hortonworks HA Namenodes 给出错误 "Operation category READ is not supported in state standby"

我的hadoop集群HA事件名称节点(host1)突然切换到备用名称节点(host2)。我无法在hadoop日志(在任何服务器中)中找到任何错误来确定根本原因。切换名称节点后,hdfs日志中经常出现以下错误,并且应用程序无法读取HDFS文件。2014-07-1701:58:53,381WARNnamenode.FSNamesystem(FSNamesystem.java:getCorruptFiles(6769))-Getcorruptfileblocksreturnederror:OperationcategoryREADisnotsupportedinstatestandby一旦我

hadoop - httpfs error Operation category READ is not supported in state standby 状态备用

我正在使用hadoopapache2.7.1,我有一个由3个节点组成的集群nn1nn2DN1nn1是dfs.default.name,所以它是主名称节点。我已经安装了httpfs并在重新启动所有服务后当然启动了它。当nn1处于事件状态且nn2处于待机状态时,我可以发送此请求http://nn1:14000/webhdfs/v1/aloosh/oula.txt?op=open&user.name=root从我的浏览器中出现打开或保存此文件的对话框,但是当我终止在nn1上运行的名称节点并正常重新启动它时,由于高可用性,nn1变为待机状态并且nn2激活。所以这里httpfs应该可以工作,即使

java - 从 Java 写入 HDFS,得到 "could only be replicated to 0 nodes instead of minReplication"

我已经下载并启动了Cloudera的HadoopDemoVMforCDH4(运行Hadoop2.0.0)。我正在尝试编写一个Java程序,它将在我的Windows7机器(运行VM的同一机器/操作系统)上运行。我有一个示例程序,例如:publicstaticvoidmain(String[]args){try{Configurationconf=newConfiguration();conf.addResource("config.xml");FileSystemfs=FileSystem.get(conf);FSDataOutputStreamfdos=fs.create(newPat