请允许我提供一个场景:hadoopjartest.jar测试inputFileFolderoutputFileFolder在哪里test.jar按键、时间和地点对信息进行排序inputFileFolder包含多个.gz文件,每个.gz文件约10GBoutputFileFolder包含一堆.gz文件我的问题是处理inputFileFolder中那些.gz文件的最佳方式是什么?谢谢! 最佳答案 Hadoop会自动检测和读取.gz文件。然而,由于.gz不是可拆分的压缩格式,每个文件将由单个映射器读取。最好的办法是使用另一种格式,例如Sna