jackson-dataformat-avro

c# - Microsoft Hadoop Avro Serializer 不支持 IEnumerable<string>

我有一个属性类型为IEnumerable的simlpe类在尝试使用反射创建序列化程序时(请参阅Microsoft.NETSDKForHadoop)它失败并出现以下异常。Couldnotfindanymatchingknowntypefor'System.Collections.Generic.IEnumerable`1[System.String]'.但是当使用string[]而不是IEnumerable时它有效使用的类[DataContract]publicclassMyClass{[DataMember]publicstringField1;[DataMember]//public

c#不支 IEnumerable section public hadoop avro azure-hdinsight

json - Hadoop Java MapReduce 使用 Jackson 问题解析 JSON

我在HadoopJavaM/R程序(0.20.205)中使用JacksonJSON解析器(1.9.5)。给定以下JSON示例:{"id":23423423,"name":"abc","location":{"displayName":"Florida,Rosario","objectType":"place"},"price":1234.55}现在，假设我只想解析出id、location.displayName和price，所以我创建了以下Java对象并省略了不需要的字段。@JsonIgnoreProperties(ignoreUnknown=true)publicclassTrans

MapReduce Jackson code displayName section json hadoop

hadoop - 如何将 spark rdd 保存到 avro 文件

我正在尝试将rdd保存到avro格式的文件中。这是我的代码的样子:valoutput=s"/test/avro/${date.toString(dayFormat)}"rmr(output)//deleteingthepathrdd.coalesce(64).saveAsNewAPIHadoopFile(output,classOf[org.apache.hadoop.io.NullWritable],classOf[PageViewEvent],classOf[AvroKeyValueOutputFormat[org.apache.hadoop.io.NullWritable,Pag

hadoop spark PageViewEvent section classOf apache-spark avro

python - spark 1.3.0、python、avro 文件、在 spark-defaults.conf 中设置的驱动程序类路径，但从属设备看不到

我正在使用带有python的spark1.3.0。我有一个使用以下命令读取avro文件的应用程序:conf=NonerddAvro=sc.newAPIHadoopFile(fileAvro,"org.apache.avro.mapreduce.AvroKeyInputFormat","org.apache.avro.mapred.AvroKey","org.apache.hadoop.io.NullWritable",KeyConverter="org.apache.spark.examples.pythonconverters.AvroWrapperToJavaConverter",

中设 python code spark section hadoop apache-spark avro

hadoop - 如何使用 AVRO org.apache.avro.mapreduce 接口(interface)进行编程？

我所有的程序都是用hadoop的新MR1接口(interface)(org.apache.hadoop.mapreduce)编写的，所以我也想使用avro的新org.apache.avro.mapreduce。但这对我不起作用。该程序接受avro数据的输入并输出相同的数据。我的程序背后的主要思想是根据avro包装的键/值对hadoop的Mapper和Reducer进行子类化。这是我的工作驱动程序的一部分:AvroJob.setInputKeySchema(job,NetflowRecord.getClassSchema());AvroJob.setOutputKeySchema(job

mapreduce interface NetflowRecord class AvroKey hadoop avro

java - 使用 Java API 将 Parquet 格式写入 HDFS，而不使用 Avro 和 MR

通过直接创建Pojo的ParquetSchema将ParquetFormat写入HDFS(使用JavaAPI)的简单方法是什么，无需使用avro和MR？我发现的示例已过时并且使用了已弃用的方法也使用了Avro、spark或MR之一。最佳答案实际上，没有很多示例可用于在没有外部框架帮助的情况下读取/写入Apacheparquet文件。核心parquet库是parquet-column，您可以在其中找到一些直接读取/写入的测试文件:https://github.com/apache/parquet-mr/blob/master/pa

Parquet java strong section hadoop hdfs

java - 失败，异常 java.io.IOException :org. apache.avro.AvroTypeException : Found long, 期望在配置单元中联合

需要帮助!!!我正在使用flume将Twitter提要流式传输到hdfs中并将其加载到hive中进行分析。步骤如下:hdfs中的数据:我已经描述了avroschema在avsc文件并将其放入hadoop中:{"type":"record","name":"Doc","doc":"adoc","fields":[{"name":"id","type":"string"},{"name":"user_friends_count","type":["int","null"]},{"name":"user_location","type":["string","null"]},{"name":

配置单 AvroTypeException 34 string name java hadoop hive

java - NoSuchMethodError 使用 Builder 将 Avro 对象写入 HDFS

将对象写入HDFS时出现此异常:Exceptioninthread"main"java.lang.NoSuchMethodError:org.apache.avro.Schema$Parser.parse(Ljava/lang/String;[Ljava/lang/String;)Lorg/apache/avro/Schema;atcom.blah.SomeType.(SomeType.java:10)它在生成的代码中引用的行是这样的:publicclassSomeTypeextendsorg.apache.avro.specific.SpecificRecordBaseimpleme

NoSuchMethodError Builder avro apache Schema java scala hadoop hdfs

hadoop - avro gradle 插件示例使用

我正在尝试使用avro-gradle-pluginongithub，但没有得到任何运气让它工作。有没有人有关于如何让它工作的示例代码？最佳答案我自己想出了办法。以下是我想与可能遇到与我相同问题的人分享的片段:applyplugin:'java'applyplugin:'avro-gradle-plugin'sourceCompatibility="1.6"targetCompatibility="1.6"buildscript{repositories{maven{//yourmavenrepoinformationhere}}

hadoop gradle section avro avro-gradle-plugin

c# - 使用 C# 反序列化 Avro 文件

我找不到使用C#反序列化ApacheAvro文件的方法。Avro文件是由Archivefeature生成的文件在MicrosoftAzure事件中心。使用Java我可以使用AvroTools从Apache将文件转换为JSON:java-jaravro-tools-1.8.1.jartojson--prettyinputfile>output.json使用NuGet包Microsoft.Hadoop.Avro我能够提取SequenceNumber,Offset和EnqueuedTimeUtc,但因为我不知道要为Body使用什么类型抛出异常。我试过Dictionary和其他类型。stati

c#34 code section azure hadoop avro