草庐IT

ParquetOutputFormat

全部标签

java - 如何在 Java 中为 Hadoop 作业的 ParquetOutputFormat 定义 Parquet 模式?

我在java中有一个Hadoop作业,它具有序列输出格式:job.setOutputFormatClass(SequenceFileOutputFormat.class);我想改用Parquet格式。我试图以天真的方式设置它:job.setOutputFormatClass(ParquetOutputFormat.class);ParquetOutputFormat.setOutputPath(job,output);ParquetOutputFormat.setCompression(job,CompressionCodecName.GZIP);ParquetOutputFormat