在使用TextInputFormat时,Hadoop似乎透明地处理压缩(这是什么时候引入的,我不记得是在0.20.203上)。不幸的是,当使用LZO压缩时,Hadoop不使用LZO索引文件来使文件可拆分。但是,如果我将输入格式设置为com.hadoop.mapreduce.LzoTextInputFormat,文件将被拆分。是否可以配置Hadoop在使用TextInputFormat时解压缩LZO文件并拆分它们? 最佳答案 我刚遇到类似的问题,这是我的理解:您想在代码中使用LzoTextInputFormat。如果你想处理lzo和非