草庐IT

cascading

全部标签

关于scala:创建像TextLine这样的Scalding Source,将多个文件组合成单个映射器

CreateScaldingSourcelikeTextLinethatcombinesmultiplefilesintosinglemappers我们有许多需要合并的小文件。在Scalding中,您可以使用TextLine将文件读取为文本行。问题是我们每个文件有1个映射器,但我们想组合多个文件,以便它们由1个映射器处理。我知道我们需要将输入格式更改为CombineFileInputFormat的实现,这可能涉及使用级联CombinedHfs。我们无法弄清楚如何做到这一点,但应该只需要几行代码来定义我们自己的名为CombineTextLine.的Scalding源非常感谢任何可以提供代码的人。

关于scala:创建像TextLine这样的Scalding Source,将多个文件组合成单个映射器

CreateScaldingSourcelikeTextLinethatcombinesmultiplefilesintosinglemappers我们有许多需要合并的小文件。在Scalding中,您可以使用TextLine将文件读取为文本行。问题是我们每个文件有1个映射器,但我们想组合多个文件,以便它们由1个映射器处理。我知道我们需要将输入格式更改为CombineFileInputFormat的实现,这可能涉及使用级联CombinedHfs。我们无法弄清楚如何做到这一点,但应该只需要几行代码来定义我们自己的名为CombineTextLine.的Scalding源非常感谢任何可以提供代码的人。