client-side-scripting

hadoop - 收到警告 ipc.Client : interrupted waiting to send params to server when copying files to HDFS

我写了一个perl脚本，其中调用了copyFromLocal来上传文件。当它运行时，WARNipc.Client:interruptedwaitingtosendparamstoserver发生。我检查了刚刚上传的HDFS上的所有文件。看来都复制成功了。谁知道那个警告是什么意思？完整的警告信息12/10/2311:41:07WARNipc.Client:interruptedwaitingtosendparamstoserverjava.lang.InterruptedExceptionatjava.util.concurrent.locks.AbstractQueuedSynchro

interrupted to java apache hadoop hdfs

hadoop - 为什么使用 yarn-client 启动 spark-shell 失败并显示 "java.lang.ClassNotFoundException: org.apache.hadoop.fs.FSDataInputStream"？

我正尝试在家里设置一个集群以满足我的个人需求(学习)。首先我做了Hadoop+Yarn。MR2正在工作。其次-我正在尝试添加Spark但收到有关缺少类的错误。[root@masterconf]#spark-shell--masteryarn-clientExceptioninthread"main"java.lang.NoClassDefFoundError:org/apache/hadoop/fs/FSDataInputStream...Causedby:java.lang.ClassNotFoundException:org.apache.hadoop.fs.FSDataInput

hadoop ClassNotFoundException code spark apache-spark hadoop-yarn

java - AmazonS3Client 在 hadoop(oozie) 中通过代理

我正在尝试通过oozie运行java代码。该代码是为非代理环境编写的，但我试图在需要代理服务器设置的环境中实现它。这是我在运行作业时遇到的错误。2015-05-1809:22:26,929WARNcom.amazonaws.http.AmazonHttpClient:UnabletoexecuteHTTPrequest:connecttimedoutjava.net.SocketTimeoutException:connecttimedout现在这是预期的行为，因为我需要通过代理传递那个，但问题是我没有看到这个连接到代理。所有人都试图直接连接到互联网，但被防火墙阻止了。我已经使用/et

中通 AmazonS3Client gt lt section java hadoop amazon-s3 proxy oozie

java - 获取 E0902 : Exception occured:[Server IPC version 9 cannot communicate with client version 4]

我的hadoop版本是2.7.1，我的oozie版本是3.3.2。我已经创建了oozie.war文件成功。但是，当我尝试使用以下命令在hdfs中创建共享库时，oozie-setup.shsharelibcreate-fshdfs://training-21:54310我得到以下异常，Stacktracefortheerrorwas(fordebugpurposes):--------------------------------------org.apache.oozie.service.HadoopAccessorException:E0902:Exceptionoccured:[

version communicate gt lt hadoop java oozie

sorting - Hadoop 在 Reduce Side Join 中按值排序

所以我只是在进行一些Hadoop培训，以了解这片土地的情况，并且我正在尝试进行reducesidejoin，我已经在运行，除了次要排序。所以基础知识:两个文件一个有球员，球队，薪水另一个有球员，球队，本垒打输出应该是球队，球员，薪水，本垒打纽约大都会队应该被划分到一个文件中，而所有其他蹩脚的球队应该被划分到另一个文件中。这些文件中的每一个都应按球队排序，其次按球员薪水排序。我正在使用团队keyplayerID加入并且有效，但我不知道我将如何按薪水排序，因为两个文件中只有一个有它。这是一项可能的任务还是只能通过map端连接来完成？最佳答案

sorting Hadoop section 薪水蹩脚

hadoop - 如何知道通过 script-runner.jar 运行的脚本中的作业流 ID、其他集群参数

我正在使用以下命令行启动弹性mapreduce集群:$elastic-mapreduce\--create\--num-instances"${INSTANCES}"\--instance-typem1.medium\--ami-version3.0.4\--name"${CLUSTER_NAME}"\--log-uri"s3://my-bucket/elasticmapreduce/logs"\--step-name"${STEP_NAME}"\--step-actionTERMINATE_JOB_FLOW\--jars3://elasticmapreduce/libs/script

script-runner hadoop section code 39 elastic-map-reduce

hadoop - HBase错误: Server IPC version 8 cannot communicate with client version 4

我使用的是hbase-0.94.9，我试着按照HBase在线书籍的介绍，但是我得到了错误:org.apache.hadoop.hbase.master.HMasterCommandLine:Failedtostartmasterjava.net.ConnectException:Calltolocalhost/127.0.0.1:8020failedonconnectionexception:java.net.ConnectException然后我在网上发现我必须先设置Hadoop，我在Hadoop2.0.5-alpha中使用了start-dfs.sh但是现在我得到这个错误，当我尝试运

version communicate code section hadoop hbase

java - 在 yarn "org.apache.hadoop.ipc.Client - Retrying connect to server: tasktracker3/10.201.2.169:50000"上运行时在 apache Pig 中出现错误

我正在运行ApachePig0.11.2和Hadoop2.2.0。我在Pig中运行的大多数简单作业都运行良好。但是，每当我尝试在大型数据集上使用GROUPBY或LIMIT运算符时，我都会收到以下连接错误:2013-12-1811:21:28,400[main]INFOorg.apache.hadoop.ipc.Client-Retryingconnecttoserver:tasktracker2/10.201.2.145:54957.Alreadytried0time(s);retrypolicyisRetryUpToMaximumCountWithFixedSleep(maxRetr

apache tasktracker3 RetryUpToMaximumCountWithFixedSle hadoop java apache-pig hadoop-yarn

java - 线程 "main"org.apache.hadoop.ipc.RemoteException : Server IPC version 9 cannot communicate with client version 4. 中的异常如何解决？

我在NetBeansIDE8.0.2中使用hadoop2.7.0和javaoraclejdk1.7.0_79。当我尝试使用Java文件与Hadoop通信时，出现以下错误。是否涉及任何依赖性问题？或者我该如何解决这个错误？我看过相关问题的帖子，但没有一个有助于清楚地传达答案。所以，请帮帮我。谢谢!Exceptioninthread"main"org.apache.hadoop.ipc.RemoteException:ServerIPCversion9cannotcommunicatewithclientversion4atorg.apache.hadoop.ipc.Client.call

version RemoteException hadoop apache java netbeans mapreduce

hadoop - kinit : Client's credentials have been revoked while getting initial credentials

我的hdp集群配置了带有AD的kerberos。所有HDP服务帐户都生成了主体和key表，包括spark。我知道服务帐户没有密码并设置为未过期。现在在执行kinit-ktspark.keytab-pspark-PRINCIPAL时出现以下错误(请参阅标题)。我在麻省理工学院的网站上读到，这是由于多次登录尝试失败或KDC中默认策略中设置的帐户过期而发生的。可以使用kadmin命令解锁帐户，例如kadmin:modprincispark/principal但我已与AD管理员进行交叉检查。他说我们在使用AD时不使用kdc服务器执行kadmin命令，但说使用ADUI检查时spark帐户处于解锁

credentials getting section spark strong hadoop apache-spark active-directory kerberos hortonworks-data-platform

156 157 158159160 161 162