草庐IT

hks_ipc_serialization

全部标签

java - 在 yarn "org.apache.hadoop.ipc.Client - Retrying connect to server: tasktracker3/10.201.2.169:50000"上运行时在 apache Pig 中出现错误

我正在运行ApachePig0.11.2和Hadoop2.2.0。我在Pig中运行的大多数简单作业都运行良好。但是,每当我尝试在大型数据集上使用GROUPBY或LIMIT运算符时,我都会收到以下连接错误:2013-12-1811:21:28,400[main]INFOorg.apache.hadoop.ipc.Client-Retryingconnecttoserver:tasktracker2/10.201.2.145:54957.Alreadytried0time(s);retrypolicyisRetryUpToMaximumCountWithFixedSleep(maxRetr

java - 线程 "main"org.apache.hadoop.ipc.RemoteException : Server IPC version 9 cannot communicate with client version 4. 中的异常如何解决?

我在NetBeansIDE8.0.2中使用hadoop2.7.0和javaoraclejdk1.7.0_79。当我尝试使用Java文件与Hadoop通信时,出现以下错误。是否涉及任何依赖性问题?或者我该如何解决这个错误?我看过相关问题的帖子,但没有一个有助于清楚地传达答案。所以,请帮帮我。谢谢!Exceptioninthread"main"org.apache.hadoop.ipc.RemoteException:ServerIPCversion9cannotcommunicatewithclientversion4atorg.apache.hadoop.ipc.Client.call

serialization - 使用 MRUnit 的 java.lang.NullPointerException。自定义 key 序列化错误

我正在尝试使用MRUnit测试一个简单的MapReduce项目。我为mapDriver设置了输入,然后调用mapDriver.runTest()(我也尝试过使用mapDriver.run()但产生了同样的错误)。我编写了一个自定义键,它重载了write(DataOutputout)、readFields(DataInputin)和compareTo(...)方法。调试时,Key使用write(DataOutputout)正确写入其数据。但是,在键的readFields(DataInputin)方法(正确检索之前使用write(DataOutputout)写入的数据)完成后,会抛出以下错

serialization - 在 Hadoop MapReduce 中为 Java 类型设置可写包装器类的原因是什么?

在我看来,可以编写一个org.apache.hadoop.io.serializer.Serialization来直接以包装类将类型序列化为相同的格式来序列化java类型。这样Mappers和Reducers就不必处理包装类。 最佳答案 没有什么可以阻止您更改序列化以使用不同的机制,例如javaSerializable接口(interface)或thrift、ProtocolBuffer等。事实上,Hadoop为JavaSerializable提供了一个(实验性的)序列化实现。对象-只需配置序列化工厂即可使用它。默认序列化机制是Wr

r - sparkR hdfs 错误 - 服务器 IPC 版本 9 无法与客户端版本 4 通信

我已经在Ubuntu中安装了sparkR以支持Hadoop版本2.4.0,按照说明here.我可以看到在以下位置./assembly/target/scala-2.10/spark-assembly-1.0.0-SNAPSHOT-hadoop2创建了带有Hadoop2.4.0和YARN支持的Spark程序集JAR.4.0.jar.下面从本地读取文件的R代码工作正常:library(SparkR)sc但是,当我尝试从hdfs读取文件时出现错误。library(SparkR)sc错误:Errorin.jcall(getJRDD(rdd),"Ljava/util/List;","collec

serialization - 在 Scalding 中读写案例类

有人可以给我指向一个链接,该链接解释了如何在scalding中读取和编写简单的案例类吗?是否有一些默认的序列化方案?例如,我有创建com.twitter.algebird.Moments管道的作业。我希望将管道写入HDFS并使用不同的作业读取它们。例如:我试着写使用:pipe.write(Tsv(outputPath))并阅读使用:classMomentsReadingExample(args:Args)extendsJob(args){valpipe=Tsv(args("input"),('term,'appearanceMoments,'totalMoments)).readval

c# - Avro .Net Serializer 忽略属性

我正在为Avro使用.Net库我有下一节C#课namespaceTest.Avro.Model{[DataContract(Name="SensorDataValue",Namespace="Sensors")]publicclassTestNm{[DataMember(Name="name")]publicstringname{get;set;}[DataMember(Name="surname",IsRequired=true)]//testtoseeifIsRequiredworkspublicstringsurname{get;set;}[DataMember(Name="co

hadoop - hbase 错误 : "10/12/26 06:48:07 INFO ipc.HbaseRPC: Server at/127.0.0.1:58920 could not be reached after 1 tries, giving up."

有人知道hbase有什么问题吗?我正在为hadoop使用cloudera发行版的vm图像,以前它工作正常但现在当我尝试列出所有表时每秒都会给我这个错误:10/12/2606:48:07信息ipc.HbaseRPC:尝试1次后无法访问位于/127.0.0.1:58920的服务器,放弃。 最佳答案 我在Ubuntu11.10上遇到了同样的问题。默认安装在/etc/hosts中添加了一行,将我的机器主机名与IP127.0.1.1相关联。我将此链接更改为指向127.0.0.1,Hbase开始工作。此外,其他计算机上类似问题的解决方案要么禁用

maven - Flink 错误 - org.apache.hadoop.ipc.RemoteException : Server IPC version 9 cannot communicate with client version 4

我正在尝试使用来自HDFS的文件运行flink作业。我创建了一个数据集如下-DataSource>visits=env.readHadoopFile(newTextInputFormat(),LongWritable.class,Text.class,Config.pathToVisits());我使用的是flink的最新版本——0.9.0-milestone-1-hadoop1(我也尝试过0.9.0-milestone-1)而我的Hadoop版本是2.6.0但是,当我尝试执行作业时出现以下异常。我搜索了类似的问题,它与客户端和hdfs之间的版本不兼容有关。Exceptioninthr

serialization - 如何将复杂对象存入hadoop Hbase?

我有复杂的对象,其中包含需要存储到Hadoop的集合字段。我不想遍历整个对象树并显式存储每个字段。所以我就想着把复杂的字段序列化,作为一个大块存储起来。而不是在读取对象时将其反序列化。那么最好的方法是什么?我考虑过为此使用某种序列化,但我希望Hadoop有办法处理这种情况。要存储的示例对象的类:classComplexClass{Listcollection;} 最佳答案 HBase只处理字节数组,所以你可以用你认为合适的任何方式序列化你的对象。序列化对象的标准Hadoop方法是实现org.apache.hadoop.io.Writ