草庐IT

proxy-protocol

全部标签

hadoop - PIG 脚本错误 : java. lang.NoSuchMethodError : org. apache.thrift.protocol.TProtocol.getScheme

我正在mapreduce模式下运行PIG脚本。该脚本读取RCFile(包含以GZIP压缩格式存储的Thrift序列化数据),使用UDF对其进行反序列化,从Thrift结构中提取某些字段并存储它们。一些映射器因以下错误而失败:2015-12-2303:07:45,638FATAL[Thread-5]org.apache.hadoop.mapred.YarnChild:Errorrunningchild:java.lang.NoSuchMethodError:org.apache.thrift.protocol.TProtocol.getScheme()Ljava/lang/Class;a

hadoop - setsockopt IPV6_TCLASS 16 : Protocol not available, Cygwin64

我正在尝试在Win8.1上使用Cygwin64安装Hadoop1.0.3。完成配置后,启动SSHD服务,我运行sshcyg_server@localhost并得到这些:cyg_server@localhost'spassword:setsockoptIPV6_TCLASS16:Protocolnotavailable:我是Cygwin64和Hadoop的新手,在此先感谢您的帮助。 最佳答案 从客户端,只需添加-oAddressFamily=inet给传递给ssh的参数,或者加上AddressFamilyinet到~/.ssh/con

amazon-web-services - 使用 Hadoop 版本 2.7.2 从 Spark 使用 S3a 协议(protocol)访问 S3

我正在尝试从pyspark(版本2.2.0)访问s3(s3a协议(protocol)),但我遇到了一些困难。我正在使用Hadoop和AWSSDK包。pyspark--packagescom.amazonaws:aws-java-sdk-pom:1.10.34,org.apache.hadoop:hadoop-aws:2.7.2这是我的代码:sc._jsc.hadoopConfiguration().set("fs.s3a.impl","org.apache.hadoop.fs.s3a.S3AFileSystem")sc._jsc.hadoopConfiguration().set("f

java - 为什么 HDFS 使用 Protocol Buffer 而不是 Java 序列化 API 进行序列化?

为什么HDFS使用ProtocolBuffer而不是Java序列化API?如果我想通过Java序列化将对象从一个数据节点发送到另一个数据节点怎么办?我已经尝试了几件事,但我收到以下错误:java.io.WriteAbortedException:写入中止;java.io.NotSerializableException:java.lang.Thread 最佳答案 因为具有外部架构定义的格式(如ProtocolBuffers)比生成非常冗长文件的内置Java序列化更节省空间。HDFS可以使用不同的格式来存储数据。提供最佳空间效率同时又

hadoop - 如何使用 LZO 以外的压缩处理 Hadoop Map/Reduce 中的 Protocol Buffer 文件?

我想使用HadoopMap/Reduce来处理delimited使用LZO以外的东西压缩的ProtocolBuffer文件,例如xz或gzip。Twitter的elephant-bird库似乎主要支持读取LZO压缩的protobuf文件,因此似乎不能满足我的需求。是否有现有的库或标准方法来执行此操作?(注意:正如您从我选择的压缩算法中看到的那样,解决方案没有必要使protobuf文件可拆分。您的答案甚至不需要指定特定的压缩算法,但应该至少允许我提到的其中之一。) 最佳答案 您可能需要查看Hadoop的RAgzip补丁,以处理大型gz

java - 在没有 Proxy 类的情况下使用方面注入(inject) InvocationHandlers

我想创建一个类,该类使用日志信息(例如,前/后语句)代理对其父类(superclass)的所有方法调用。但是,使用此类的框架将通过新的(..)调用加载它,或者通过其他反射机制加载它,因此我无法使用代理语义来启动该类。有没有办法让new和newInstance()操作在所有情况下都使用代理-或者我们是否必须使用代理API显式创建InvocationHandler类的实例?具体来说:我正在调试一个分布式框架,它已经有自己的方式在运行时从XML文件创建类实例(hadoop-mapreduce)。 最佳答案 我认为您不能轻易地在Java中使

hadoop - CDH5 Hue Hive — 蜂蜡服务器 : Error opening session: Failed to validate proxy privilage of hue for admin

我通过Kerberos设置了一个具有安全性的Hadoop集群,Hive已经启用了Sentry。我对Hue-Hive(Beeswax)Editor有疑问。Hue无法在hive-server2日志中加载来自hive的数据和信息:2014-04-0311:36:39,814WARNthrift.ThriftCLIService(ThriftCLIService.java:GetSchemas(364))-Errorgettingcatalogs:org.apache.hive.service.cli.HiveSQLException:InvalidSessionHandle:SessionH

java - 使用 native 协议(protocol)的 Cassandra 自定义 map-reduce 输入格式化程序

我正在使用ApacheCassandra(1.2)和ApacheMap-Reduce处理一些数据。目前,我使用org.apache.cassandra.hadoop.cql3中的CqlPagingInputFormat。此提供程序使用Thrift来提取数据。Thrift似乎相当慢(300M记录,在3节点集群中需要8多个小时才能读取),并且由于存在原生二进制协议(protocol),我想知道是否有人使用过它。我对任何其他优化和配置调整不感兴趣-这是一个单独的问题。我的问题是是否有直接使用Cassandranative协议(protocol)的map-reduce输入格式化程序的实现?如果

hadoop - 是否有 HDFS 客户端有线协议(protocol)规范?

我有兴趣找出为HDFS客户端定义的有线协议(protocol)。我能找到的只是各种HDFS客户端绑定(bind)的源代码。如果有人可以指出协议(protocol)规范,我们将不胜感激。谢谢。 最佳答案 从Hadoop0.23+开始,所有协议(protocol)都切换到了ProtocolBuffers。可以找到HDFS协议(protocol)定义here.还有一个WebHDFS向HDFS添加REST接口(interface)的实现。但是,IIRC,像Horotonworks和Cloudera这样的大供应商还不推荐使用它。

hadoop 2.6.2,mkdir : Couldn't create proxy provider null

我无法创建新文件或目录,也无法列出现有文件或目录我正在使用下面的命令来做这个操作,你能建议一下吗hduser@c:/usr/local/hadoop$jps8546ResourceManager9181Jps1503NameNode8674NodeManager4398DataNodehduser@c:/usr/local/hadoop$bin/hadoopfs-ls/ls:Couldn'tcreateproxyprovidernullhduser@c:/usr/local/hadoop$bin/hadoopfs-mkdir/booksmkdir:Couldn'tcreateproxy