草庐IT

hks_client_service_adapter

全部标签

hadoop - Spark 错误 : Server IPC version 9 cannot communicate with client version 4

我运行的是hadoop2.7.0版本、scala2.10.4、java1.7.0_21和spark1.3.0我创建了一个如下所示的小文件hduser@ubuntu:~$cat/home/hduser/test_sample/sample1.txtEid1,EName1,EDept1,100Eid2,EName2,EDept1,102Eid3,EName3,EDept1,101Eid4,EName4,EDept2,110Eid5,EName5,EDept2,121Eid6,EName6,EDept3,99运行以下命令时出现错误。scala>valemp=sc.textFile("/hom

Docker Service 创建

DockerSwarmModeDockerSwarm集群搭建DockerSwarm节点维护DockerService创建service只能依附于dockerswarm集群,所以service的创建前提是,swarm集群搭建完毕。1.创建servicedockerservicecreate命令用于创建service,需要在manager中运行。与创建容器的命令dockerrun非常类似目前的节点状态如下:在swarm中创建一个运行tomcat:8.5.49镜像的service,服务名称为toms,包含3个副本task,对外映射端口号为9000。当一个service包含多个task时,对servi

amazon-web-services - 如何使用 "s3a://"方案让 Hive 2.2.1 成功与 AWS S3 集成

我遵循了各种已发布的文档,了解如何使用s3a://方案将ApacheHive2.1.1与AWSS3集成,配置fs.s3a.access.key和fs.s3a.secret.key用于hadoop/etc/hadoop/core-site.xml和hive/conf/hive-site.xml.我现在可以让hdfsdfs-lss3a://[bucket-name]/正常工作(它返回那个桶的s3ls)。所以我知道我的信用、存储桶访问和整体Hadoop设置是有效的。hdfsdfs-lss3a://[bucket-name]/drwxrwxrwx-hdfshdfs02017-06-2722:4

amazon-web-services - Hadoop 配置单元无法在 AWS EMR 上扩展

我正在hadoophive上运行一个实验。在这个实验中,我在2个不同的硬件设置上运行相同的配置单元作业。它托管在AWSEMR中。这是我运行的hive.sql脚本:DROPDATABASEIFEXISTSlabtest;CREATEDATABASElabtest;CREATETABLEIFNOTEXISTSlaborder(InserttsTIMESTAMP,ordernrSTRING,PatientnrSTRING,visitnrSTRING)ROWFORMATSERDE'org.apache.hadoop.hive.serde2.OpenCSVSerde'WITHSERDEPROPE

hadoop - java.io.IOException :java. lang.ClassCastException : org. apache.hadoop.hbase.client.Result 无法转换为 org.apache.hadoop.io.Writable

尝试了一个从hive处理hbase中的表的示例。CREATEEXTERNALTABLE命令成功,但是select语句给出类转换异常环境:hive0.12.0,hbase0.96.1,hadoop2.2,Virtualbox上的Ubuntu12.04hive>SHOWTABLES;OKhbatablese_myhiveTimetaken:0.309seconds,Fetched:1row(s)hive>SELECT*FROMhbatablese_myhive;OK**异常失败java.io.IOException:java.lang.ClassCastException:org.apac

hadoop - java.io.IOException : org. apache.hadoop.security.AccessControlException : Client cannot authenticate via:[TOKEN, KERBEROS]

我的配置如下:运行Spark1.2.0,Hadoop2.5.0/YARN,ClouderaCDH5VMCentos6.2运行Windows64位平台8GBRAM下面是从spark-shell运行的命令序列,但在尝试打印custRDD时,我收到Kerberos身份验证错误。我已经从cloudera用户登录到spark-shell,ClouderaVM是Kerberos认证的,默认主体是cloudera@HADOOP.LOCALDOMAIN对于正常的RDD操作,有什么方法可以从spark-shell验证Kerberos吗?或者我遗漏了什么?感谢任何正当的帮助,将得到返回下面是SparkSh

web-services - 在 WSO2 ESB 后序代理服务中配置 Hadoop 端点

我必须为WSO2ESB中的代理服务的序列设置一个Hadoop端点。我应该将WS响应传送到Hadoop文件存储库中。以下是将文件写入Hadoop的PUT命令的语法:2-stepcommandsforfile-writing如何实现在Hadoop上保存WS响应的后续执行这2个步骤的工作代理? 最佳答案 首先,在inSequence中,您可以调用调解器来请求url。接下来,您可以从上述响应中提取header并将其设置为下一个请求的“To”header。然后使用发送或调用中介通过“默认”端点发送内容(默认端点通过查看“To”header将消

linux - Hadoop 信息 ipc.Client : Retrying connect to server localhost/127. 0.0.1:9000

我阅读了其他关于Hadoop的HDFS配置问题的帖子。然而,他们都没有帮助。所以,我发布我的问题。我关注了thishadoopv1.2.1教程。当我运行hadoopfs-ls命令时出现此错误:16/08/2915:20:35INFOipc.Client:Retryingconnecttoserver:localhost/127.0.0.1:9000.Alreadytried0time(s);retrypolicyisRetryUpToMaximumCountWithFixedSleep(maxRetries=10,sleepTime=1SECONDS)我的core-site.xml文件

amazon-web-services - spark aws S3a ARN(亚马逊资源名称)IAM 角色

我正在使用spark2.3.0和Hadoop2.7(但如果需要我可以升级)我想访问具有ARN(亚马逊资源名称)IAM角色的S3文件https://docs.aws.amazon.com/cli/latest/userguide/cli-multiple-profiles.html我已经看过这个Howtoaccesss3a://filesfromApacheSpark?但是没有关于IAM访问的问题publicclasstest{publicstaticvoidmain(String[]args){SparkSessionsc=newSparkSession.Builder().appNa

amazon-web-services - AWS EMR 在加速端点配置上抛出异常

这是我使用的EMR步骤,s3-dist-cp--targetSize1000--outputCodec=gz--s3Endpoint=bucket.s3-accelerate.amazonaws.com--groupBy'./(\d\d)/\d\d/\d\d/.'--srcs3a://sourcebucket/--dests3a://destbucket/加速端点异常。电子病历版本:Releaselabel:emr-5.13.0Hadoopdistribution:Amazon2.8.3Applications:Hive2.3.2,Pig0.17.0,Hue4.1.0,Presto0.