serial_port_草庐IT

serialization - 如何将 Kryo 设置为 Writable 的替代品作为 HDFS/Hadoop 中的序列化框架

如何将Kryo设置为我的序列化框架来代替Writable？子问题:如何设置要序列化/反序列化的对象，就像我们对Writable所做的那样？最佳答案将io.serializations属性设置为逗号分隔的类名列表以注册序列化实现。它的默认值是org.apache.hadoop.io.serializer.WritableSerialization，这意味着只有Writable对象可以开箱即用地序列化或反序列化。引用-http://my.safaribooksonline.com/book/databases/hadoop/9780

hadoop - 无法启动 TaskTracker.Says 无法启动任务跟踪器，因为 java.lang.IllegalArgumentException : Does not contain a valid host:port authority:

编辑了mapred-site.xml、core-site.xml、hadoop-env.sh、hdfs-site.xml、masters和slaves。我有1个DataNode和2个Namenode。它们都成功启动，我可以在浏览器中看到它们。启动了start-mapred.sh并在Namenode上启动了JobTracker和TaskTracker，但无法在datanaode上启动Tasktracker。启动Tasktracker，输出如下。->hadooptasktrackerWarning:$HADOOP_HOMEisdeprecated.13/10/1703:21:55INFOm

跟踪器 IllegalArgumentException TaskTracker mapred hadoop ubuntu-12.04

hadoop - 在配置单元 "Unable to retrieve URL for Hadoop Task logs. Does not contain a valid host:port authority: local"上出现错误

在涉及mapreduce的hive上执行任何查询时，我收到此错误。“UnabletoretrieveURLforHadoopTasklogs.Doesnotcontainavalidhost:portauthority:local” 最佳答案报告的异常出现在旧版本的Hadoop中(即YARN之前)。大多数情况下，您使用的是旧版本的Hadoop。当mapred.job.tracker的值出现异常参数在local中设置为“mapred-site.xml”相反，它应该是:. 关于hadoop

配置单 amp section code Hadoop hive

java - Spark saveAsNewAPIHadoopFile java.io.IOException : Could not find a serializer for the Value class

我正在尝试将java对RDD存储为Hadoop序列文件，如下所示:JavaPairRDDputRdd=...config.set("io.serializations","org.apache.hadoop.io.serializer.JavaSerialization,org.apache.hadoop.io.serializer.WritableSerialization");putRdd.saveAsNewAPIHadoopFile(outputPath,ImmutableBytesWritable.class,Put.class,SequenceFileOutputFormat

saveAsNewAPIHadoopFile java apache SequenceFile hadoop apache-spark serialization hdfs

Regex SerDe 不支持 serialize() 方法错误

我的表结构如下。CREATETABLEdb.TEST(f1string,f2string,f3string)ROWFORMATSERDE'org.apache.hadoop.hive.serde2.RegexSerDe'WITHSERDEPROPERTIES('input.regex'='(.{2})(.{3})(.{4})')STOREDASINPUTFORMAT'org.apache.hadoop.mapred.TextInputFormat'OUTPUTFORMAT'org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputForma

不支 serialize 39 apache RegexSerDe regex hadoop hive hiveql

hadoop - 主机 :port pair: PBUF

我正在使用的版本，Hadoop2.2.0和HBase0.96.1.1，所有节点中的Hive0.12.0谁能解释给我的这个错误？hive>CREATEEXTERNALTABLEtest(keystring,valuesmap)STOREDBY'org.apache.hadoop.hive.hbase.HBaseStorageHandler'WITHSERDEPROPERTIES("hbase.columns.mapping"=":key,values:"TBLPROPERTIES("hbase.table.name"="test");FAILED:ExecutionError,retur

hadoop PBUF section code hbase hive

serialization - 使用 MRUnit 的 java.lang.NullPointerException。自定义 key 序列化错误

我正在尝试使用MRUnit测试一个简单的MapReduce项目。我为mapDriver设置了输入，然后调用mapDriver.runTest()(我也尝试过使用mapDriver.run()但产生了同样的错误)。我编写了一个自定义键，它重载了write(DataOutputout)、readFields(DataInputin)和compareTo(...)方法。调试时，Key使用write(DataOutputout)正确写入其数据。但是，在键的readFields(DataInputin)方法(正确检索之前使用write(DataOutputout)写入的数据)完成后，会抛出以下错

自定 NullPointerException java code junit serialization hadoop mapreduce mrunit

serialization - 在 Hadoop MapReduce 中为 Java 类型设置可写包装器类的原因是什么？

在我看来，可以编写一个org.apache.hadoop.io.serializer.Serialization来直接以包装类将类型序列化为相同的格式来序列化java类型。这样Mappers和Reducers就不必处理包装类。最佳答案没有什么可以阻止您更改序列化以使用不同的机制，例如javaSerializable接口(interface)或thrift、ProtocolBuffer等。事实上，Hadoop为JavaSerializable提供了一个(实验性的)序列化实现。对象-只需配置序列化工厂即可使用它。默认序列化机制是Wr

serialization MapReduce section hadoop code writable

serialization - 在 Scalding 中读写案例类

有人可以给我指向一个链接，该链接解释了如何在scalding中读取和编写简单的案例类吗？是否有一些默认的序列化方案？例如，我有创建com.twitter.algebird.Moments管道的作业。我希望将管道写入HDFS并使用不同的作业读取它们。例如:我试着写使用:pipe.write(Tsv(outputPath))并阅读使用:classMomentsReadingExample(args:Args)extendsJob(args){valpipe=Tsv(args("input"),('term,'appearanceMoments,'totalMoments)).readval

serialization Scalding 39 section Moments hadoop casting case-class

c# - Avro .Net Serializer 忽略属性

我正在为Avro使用.Net库我有下一节C#课namespaceTest.Avro.Model{[DataContract(Name="SensorDataValue",Namespace="Sensors")]publicclassTestNm{[DataMember(Name="name")]publicstringname{get;set;}[DataMember(Name="surname",IsRequired=true)]//testtoseeifIsRequiredworkspublicstringsurname{get;set;}[DataMember(Name="co

c#Serializer 34 code name .net hadoop avro