草庐IT

compact_protocol

全部标签

hadoop - 如何使用 LZO 以外的压缩处理 Hadoop Map/Reduce 中的 Protocol Buffer 文件?

我想使用HadoopMap/Reduce来处理delimited使用LZO以外的东西压缩的ProtocolBuffer文件,例如xz或gzip。Twitter的elephant-bird库似乎主要支持读取LZO压缩的protobuf文件,因此似乎不能满足我的需求。是否有现有的库或标准方法来执行此操作?(注意:正如您从我选择的压缩算法中看到的那样,解决方案没有必要使protobuf文件可拆分。您的答案甚至不需要指定特定的压缩算法,但应该至少允许我提到的其中之一。) 最佳答案 您可能需要查看Hadoop的RAgzip补丁,以处理大型gz

java - 使用 native 协议(protocol)的 Cassandra 自定义 map-reduce 输入格式化程序

我正在使用ApacheCassandra(1.2)和ApacheMap-Reduce处理一些数据。目前,我使用org.apache.cassandra.hadoop.cql3中的CqlPagingInputFormat。此提供程序使用Thrift来提取数据。Thrift似乎相当慢(300M记录,在3节点集群中需要8多个小时才能读取),并且由于存在原生二进制协议(protocol),我想知道是否有人使用过它。我对任何其他优化和配置调整不感兴趣-这是一个单独的问题。我的问题是是否有直接使用Cassandranative协议(protocol)的map-reduce输入格式化程序的实现?如果

hadoop - 是否有 HDFS 客户端有线协议(protocol)规范?

我有兴趣找出为HDFS客户端定义的有线协议(protocol)。我能找到的只是各种HDFS客户端绑定(bind)的源代码。如果有人可以指出协议(protocol)规范,我们将不胜感激。谢谢。 最佳答案 从Hadoop0.23+开始,所有协议(protocol)都切换到了ProtocolBuffers。可以找到HDFS协议(protocol)定义here.还有一个WebHDFS向HDFS添加REST接口(interface)的实现。但是,IIRC,像Horotonworks和Cloudera这样的大供应商还不推荐使用它。

hadoop - 如何在 Hadoop 中刷新 job.submission.protocol.acl 的服务 ACL

我正在使用Cloudera的HadoopCDH发行版,并且最近从CDH3升级到了CDH4。在CDH3中,我曾经能够将用户名添加到hadoop-policy.xml中,用于:security.client.protocol.aclsecurity.job.submission.protocol.acl然后运行:hadoopdfsadmin-refreshServiceAclhadoopmradmin-refreshServiceAcl而且,瞧,用户可以访问HDFS并运行MR作业。自从升级到CDH4后,现在添加了第一个用户,看起来有些东西发生了变化。仍然在hadoop-policy.xml

Hadoop shuffle 使用哪种协议(protocol)?

在Hadoop数据的洗牌阶段,映射数据在集群的节点之间传输根据reducer的分区。Hadoop使用什么协议(protocol)在reduce阶段跨节点执行数据洗牌? 最佳答案 我第一次真的笑了,但是整个洗牌和合并是由一个HTTPServlet完成的。您可以在匿名类MapOutputServlet的Tasktrackers源代码中看到这一点。它获取带有任务和作业ID的HTTP请求,然后它将传输传入的输入流进入磁盘上的本地文件系统。 关于Hadoopshuffle使用哪种协议(protoc

ssh - 如何通过 java 的 hdfs 协议(protocol)访问 hadoop?

我找到了一种通过hftp连接到hadoop的方法,它工作正常,(只读):uri="hftp://172.16.xxx.xxx:50070/";System.out.println("uri:"+uri);Configurationconf=newConfiguration();FileSystemfs=FileSystem.get(URI.create(uri),conf);fs.printStatistics();但是,我想读/写以及复制文件,也就是说,我想通过hdfs连接。如何启用hdfs连接以便我可以编辑实际的远程文件系统?我试图从hftp->hdfs更改上面的协议(protoc

hadoop - Protocol Buffer 错误 : Hbase createTable & put in java code(protobuf-LiteralByteString)

我正在使用kafka、sparkstream和hbase开发java应用程序。通过mavencleaninstall编译代码后,当我运行我的应用程序时遇到以下错误:hadoop版本:2.7.3HBase版本:hbase-0.98.24-hadoop2星火:2.1.0虽然我已经检查并应用了该站点中以前的答案,但我仍然遇到了问题。谢谢...`Exceptioninthread"main"org.apache.hadoop.hbase.DoNotRetryIOException:java.lang.NoClassDefFoundError:com/google/protobuf/Litera

hadoop 协议(protocol)消息太大。可能是恶意的。使用 CodedInputStream.setSizeLimit() 增加大小限制

我在数据节点的日志中看到了这一点。这可能是因为我正在将500万个文件复制到HDFS中:java.lang.IllegalStateException:com.google.protobuf.InvalidProtocolBufferException:Protocolmessagewastoolarge.Maybemalicious.UseCodedInputStream.setSizeLimit()toincreasethesizelimit.atorg.apache.hadoop.hdfs.protocol.BlockListAsLongs$BufferDecoder$1.next

php - 是否可以将 PHP 连接到 SQL Server Compact Edition?

是否可以将PHP连接到SQLServerCompactEdition数据库?最好的司机是什么?我需要它用于SQLServerExpress太重的桌面应用程序。 最佳答案 简短回答:否。长答案:据我所知,与PostgreSQL/MySQL/MS-SQL不同,没有将PHP连接到SQLServerCompactEdition的native驱动程序。如果要连接到它,最好的办法是使用PHPODBC连接与连接到SQLCompact服务器的ODBC驱动程序对话。但这几乎是一种黑客攻击,你会为任何非常重要的事情使用这种东西而疯狂。如果您担心SQLS

php - 任何 PHP 框架都实现了 ODATA 协议(protocol)?

关闭。这个问题不符合StackOverflowguidelines.它目前不接受答案。我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题,以便用事实和引用来回答。关闭6年前。Improvethisquestion是否有任何php框架实现了odata协议(protocol),原生的或扩展的?我需要使用breezejs在客户端上,我希望我不必自己实现odata的所有服务器端工作。如果没有这样的东西,有没有breezejs的替代品?jaydata不是替代方案,因为实际上它也需要服务器端实现odata协议(protocol),所以它们太相似了。Rest服务(如angularjs中的r