草庐IT

jackson-dataformat-avro

全部标签

有趣的Hack-A-Sat黑掉卫星挑战赛——定位卫星Jackson

国家太空安全是国家安全在空间领域的表现。随着太空技术在政治、经济、军事、文化等各个领域的应用不断增加,太空已经成为国家赖以生存与发展的命脉之一,凝聚着巨大的国家利益,太空安全的重要性日益凸显[1]。而在信息化时代,太空安全与信息安全紧密地结合在一起。2020年9月4日,美国白宫发布了首份针对太空网络空间安全的指令——《航天政策第5号令》,其为美国首个关于卫星和相关系统网络安全的综合性政策,标志着美国对太空网络安全的重视程度达到新的高度。在此背景下,美国自2020年起,连续两年举办太空信息安全大赛“黑掉卫星(Hack-A-Sat)”,在《Hack-A-Sat太空信息安全挑战赛深度解析》一书中有详

使用Spring Cloud流使用Contruent模式注册表生成AVRO消息

我是SpringCloud流的新手,并试图根据Confluent模式注册表生成AVRO消息。我可以得到一个非常基本的例子,https://cloud.spring.io/spring-cloud-stream/工作,但是当我尝试将其进一步扩展以使用Avro时,我会得到例外。作为通用测试环境,我正在运行Docker映像:https://github.com/landoop/fast-data-dev/使用SpringInitializr生成了测试项目,并稍作修改:https://start.spring.io/pom.xml:4.0.0com.demo.kafkakafka-demo0.0.1-

hadoop - 使用 Pig/Python 检查 HDFS avro 格式的字段是否存在

我在HDFS中有一组以Avro格式存储的文件。其中一些有一个名为id:int的列,如下所示{"type":"record","name":"metric","fields":[{"name":"timestamp","type":"long"},{"name":"id","type":"long"},{"name":"metric","type":"string"},{"name":"value","type":"double"}]}我需要标记具有“id”列的文件(输出文件名)。有没有办法在Python中使用Pig/PythonUDF/Pig流或嵌入式Pig来完成它。我已经将Pytho

hadoop - 启动 spark-submit 时出错,因为 avro

我正在用spark创建一个应用程序。我在Hadoop2的HDFS中使用avro文件。我使用maven并像这样包含avro:org.apache.avroavro-mapred1.7.6hadoop2我做了一个单元测试,当我使用mvntest时,一切正常。但是当我用spark启动时提交没有!我有这个错误:Exceptioninthread"main"org.apache.spark.SparkException:Jobabortedduetostagefailure:Task1instage0.0failed1times,mostrecentfailure:Losttask1.0inst

hadoop - 如何在 MRUnit 中使用 avro 参数测试 reducer ?

我正在尝试测试下面的ReducerReducer,AvroKey,NullWritable>出于这些目的,我在测试中使用了下一个代码:CustomReducerreducer=newCustomReducer();reduceDriver=newReduceDriver,AvroKey,NullWritable>();Jobjob=newJob();reduceDriver=ReduceDriver.newReduceDriver(reducer).withConfiguration(job.getConfiguration());reduceDriver.setReducer(red

hadoop - 无法描述使用 avro serde 创建的 Hive 表

我已经使用Avroserde创建了一个Hive表。下面是我从网站上复制来创建表格的代码。createtableNEW_TABLErowformatserde'org.apache.hadoop.hive.serde2.avro.AvroSerDe'storedasinputformat'org.apache.hadoop.hive.ql.io.avro.AvroContainerInputFormat'outputformat'org.apache.hadoop.hive.ql.io.avro.AvroContainerOutputFormat'tblproperties('avro.

hadoop - 如何使用 Spark 编写 avro 文件?

我有一个Array[Byte]代表一个avro模式。我正在尝试将它作为带有spark的avro文件写入Hdfs。这是代码:valvalues=messages.map(row=>(null,AvroUtils.decode(row._2,topic))).saveAsHadoopFile(outputPath,classOf[org.apache.hadoop.io.NullWritable],classOf[CrashPacket],classOf[AvroOutputFormat[SpecificRecordBase]])row._2是Array[Byte]我收到此错误:org.a

hadoop - 三个: Presto, hive和impala是否都支持Avro数据格式?

我很清楚Hive中可用的Serde来支持数据格式的Avro模式。熟悉将avro与hive结合使用。AvroSerDe比方说,我已经发现了这个问题。https://github.com/prestodb/presto/issues/5009我需要选择组件以实现快速执行周期。Presto和impala提供更短的执行周期。所以,任何人都请让我澄清一下在不同的数据格式中哪个更好。首先,我现在正在寻找Presto的avro支持。但是,让我们考虑以下存储在HDFS上的数据格式:Avro格式Parquet格式兽人格式哪个最适合用于不同数据格式的高性能。??请提出建议。 最

scala - 读取保存在 HBase 列中的 AVRO 结构

我是Spark和HBase的新手。我正在处理HBase表的备份。这些备份位于S3存储桶中。我正在使用newAPIHadoopFile通过spark(scala)阅读它们,如下所示:conf.set("io.serializations","org.apache.hadoop.io.serializer.WritableSerialization,org.apache.hadoop.hbase.mapreduce.ResultSerialization")valdata=sc.newAPIHadoopFile(path,classOf[SequenceFileInputFormat[Im

hadoop - Hive 上的 Avro 动态模式更改

我有一些数据采用avro格式v1并存储在分区dt=yyyymmdd下的HDFS中。现在数据在同一个分区下维护了两个版本,v1和v2。为两个不同的版本维护一个hive表是否可行? 最佳答案 Avrodefinesaschemaevolutionprotocol例如,如果v2只是添加了一个具有默认值的字段,然后使用该架构更新表,它可以读取全部旧数据,因为它会简单地返回默认值缺失的地方。如果你破坏了兼容性,你必须创建一个单独的表,然后将两者合并以获得一致的结果集 关于hadoop-Hive上的