我有一个基于文本的压缩日志文件目录,每个文件包含许多记录。在旧版本的Hadoop中,我会扩展MultiFileInputFormat以返回一个自定义的RecordReader,它解压缩日志文件并从那里继续。但我正在尝试使用Hadoop0.20.2。在Hadoop0.20.2文档中,我注意到MultiFileInputFormat已被弃用,取而代之的是CombineFileInputFormat。但要扩展CombineFileInputFormat,我必须使用已弃用的类JobConf和InputSplit。MultiFileInputFormat的现代等价物,或者从文件目录获取记录的现代