草庐IT

serial_port

全部标签

serialization - 如何将 Kryo 设置为 Writable 的替代品作为 HDFS/Hadoop 中的序列化框架

如何将Kryo设置为我的序列化框架来代替Writable?子问题:如何设置要序列化/反序列化的对象,就像我们对Writable所做的那样? 最佳答案 将io.serializations属性设置为逗号分隔的类名列表以注册序列化实现。它的默认值是org.apache.hadoop.io.serializer.WritableSerialization,这意味着只有Writable对象可以开箱即用地序列化或反序列化。引用-http://my.safaribooksonline.com/book/databases/hadoop/9780

hadoop - 无法启动 TaskTracker.Says 无法启动任务跟踪器,因为 java.lang.IllegalArgumentException : Does not contain a valid host:port authority:

编辑了mapred-site.xml、core-site.xml、hadoop-env.sh、hdfs-site.xml、masters和slaves。我有1个DataNode和2个Namenode。它们都成功启动,我可以在浏览器中看到它们。启动了start-mapred.sh并在Namenode上启动了JobTracker和TaskTracker,但无法在datanaode上启动Tasktracker。启动Tasktracker,输出如下。->hadooptasktrackerWarning:$HADOOP_HOMEisdeprecated.13/10/1703:21:55INFOm

hadoop - 在配置单元 "Unable to retrieve URL for Hadoop Task logs. Does not contain a valid host:port authority: local"上出现错误

在涉及mapreduce的hive上执行任何查询时,我收到此错误。“UnabletoretrieveURLforHadoopTasklogs.Doesnotcontainavalidhost:portauthority:local” 最佳答案 报告的异常出现在旧版本的Hadoop中(即YARN之前)。大多数情况下,您使用的是旧版本的Hadoop。当mapred.job.tracker的值出现异常参数在local中设置为“mapred-site.xml”相反,它应该是:. 关于hadoop

java - Spark saveAsNewAPIHadoopFile java.io.IOException : Could not find a serializer for the Value class

我正在尝试将java对RDD存储为Hadoop序列文件,如下所示:JavaPairRDDputRdd=...config.set("io.serializations","org.apache.hadoop.io.serializer.JavaSerialization,org.apache.hadoop.io.serializer.WritableSerialization");putRdd.saveAsNewAPIHadoopFile(outputPath,ImmutableBytesWritable.class,Put.class,SequenceFileOutputFormat

Regex SerDe 不支持 serialize() 方法错误

我的表结构如下。CREATETABLEdb.TEST(f1string,f2string,f3string)ROWFORMATSERDE'org.apache.hadoop.hive.serde2.RegexSerDe'WITHSERDEPROPERTIES('input.regex'='(.{2})(.{3})(.{4})')STOREDASINPUTFORMAT'org.apache.hadoop.mapred.TextInputFormat'OUTPUTFORMAT'org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputForma

hadoop - 主机 :port pair: PBUF

我正在使用的版本,Hadoop2.2.0和HBase0.96.1.1,所有节点中的Hive0.12.0谁能解释给我的这个错误?hive>CREATEEXTERNALTABLEtest(keystring,valuesmap)STOREDBY'org.apache.hadoop.hive.hbase.HBaseStorageHandler'WITHSERDEPROPERTIES("hbase.columns.mapping"=":key,values:"TBLPROPERTIES("hbase.table.name"="test");FAILED:ExecutionError,retur

serialization - 使用 MRUnit 的 java.lang.NullPointerException。自定义 key 序列化错误

我正在尝试使用MRUnit测试一个简单的MapReduce项目。我为mapDriver设置了输入,然后调用mapDriver.runTest()(我也尝试过使用mapDriver.run()但产生了同样的错误)。我编写了一个自定义键,它重载了write(DataOutputout)、readFields(DataInputin)和compareTo(...)方法。调试时,Key使用write(DataOutputout)正确写入其数据。但是,在键的readFields(DataInputin)方法(正确检索之前使用write(DataOutputout)写入的数据)完成后,会抛出以下错

serialization - 在 Hadoop MapReduce 中为 Java 类型设置可写包装器类的原因是什么?

在我看来,可以编写一个org.apache.hadoop.io.serializer.Serialization来直接以包装类将类型序列化为相同的格式来序列化java类型。这样Mappers和Reducers就不必处理包装类。 最佳答案 没有什么可以阻止您更改序列化以使用不同的机制,例如javaSerializable接口(interface)或thrift、ProtocolBuffer等。事实上,Hadoop为JavaSerializable提供了一个(实验性的)序列化实现。对象-只需配置序列化工厂即可使用它。默认序列化机制是Wr

serialization - 在 Scalding 中读写案例类

有人可以给我指向一个链接,该链接解释了如何在scalding中读取和编写简单的案例类吗?是否有一些默认的序列化方案?例如,我有创建com.twitter.algebird.Moments管道的作业。我希望将管道写入HDFS并使用不同的作业读取它们。例如:我试着写使用:pipe.write(Tsv(outputPath))并阅读使用:classMomentsReadingExample(args:Args)extendsJob(args){valpipe=Tsv(args("input"),('term,'appearanceMoments,'totalMoments)).readval

c# - Avro .Net Serializer 忽略属性

我正在为Avro使用.Net库我有下一节C#课namespaceTest.Avro.Model{[DataContract(Name="SensorDataValue",Namespace="Sensors")]publicclassTestNm{[DataMember(Name="name")]publicstringname{get;set;}[DataMember(Name="surname",IsRequired=true)]//testtoseeifIsRequiredworkspublicstringsurname{get;set;}[DataMember(Name="co