reducing_草庐IT

hadoop map reduce二次排序

任何人都可以解释一下hadoop中的二次排序是如何工作的吗？为什么必须使用GroupingComparator以及它在hadoop中如何工作？我浏览了下面给出的链接，对groupcomapator的工作原理产生了疑问。任何人都可以向我解释分组比较器的工作原理吗？http://www.bigdataspeak.com/2013/02/hadoop-how-to-do-secondary-sort-on_25.html 最佳答案我发现借助图表很容易理解某些概念，这当然是其中之一。假设我们的二次排序是基于由姓氏和名字组成的复合键。有了复

hadoop - hadoop map reduce中分组比较器有什么用

我想知道为什么在二级mapreduce中使用分组比较器。根据二次排序的最终指南示例我们希望键的排序顺序是按年份(升序)然后按温度(降序):190035°C190034°C190034°C...190136°C190135°C通过设置分区器按键的年份部分进行分区，我们可以保证同一年的记录进入同一个reducer。这仍然不足以实现我们的目标，但是。分区器确保只有一个reducer接收所有记录一年;它不会改变reducer在分区内按键分组的事实。既然我们已经编写了自己的分区器来处理映射到特定reducer的输出键，那么我们为什么要对它进行分组。提前致谢最佳答案

中分 hadoop nbsp amp section mapreduce hadoop-partitioning

hadoop:0 reducer 和 identity reducer 之间的区别？

我只是想确认我对0reducer和identityreducer之间区别的理解。0reducer意味着reduce步骤将被跳过，mapper输出将是最终输出Identityreducer意味着洗牌/排序仍然会发生吗？最佳答案你的理解是正确的。我将其定义如下:如果您不需要对map结果进行排序-您可以设置0减少，并且该作业仅称为map。如果您需要对映射结果进行排序，但不需要任何聚合——您可以选择identityreducer。为了完成这幅图，我们有第三种情况:我们确实需要聚合，在这种情况下我们需要缩减器。

reducer identity section hadoop mapreduce

hadoop - Hive 无法手动设置 reducer 的数量

我有以下配置单元查询:selectcount(distinctid)astotalfrommytable;自动生成:1408映射器1reducer我需要手动设置reducer的数量，我尝试了以下方法:setmapred.reduce.tasks=50sethive.exec.reducers.max=50但这些设置似乎都没有得到遵守。查询需要永远运行。有没有办法手动设置reducer或者重写查询以便产生更多的reducer？谢谢! 最佳答案像这样在配置单元中编写查询:SELECTCOUNT(DISTINCTid)....将始终只使

reducer hadoop section code mapreduce hive

hadoop - Hadoop 中的 reduce 任务什么时候开始？

在Hadoop中，reduce任务什么时候开始？它们是否在一定比例(阈值)的映射器完成后开始？如果是这样，这个阈值是固定的吗？通常使用什么样的阈值？最佳答案 reduce阶段有3个步骤:shuffle、sort、reduce。Shuffle是reducer从每个mapper收集数据的地方。这可能在映射器生成数据时发生，因为它只是数据传输。另一方面，排序和归约只能在所有映射器完成后才能开始。您可以通过查看reducer完成百分比来判断MapReduce在做什么:0-33%表示它在做shuffle，34-66%是排序，67%-100%

hadoop 射器 code reduce mapreduce

sorting - Map Reduce Programming中reducer中洗牌和排序阶段的目的是什么？

在MapReduce编程中，reduce阶段有洗牌、排序和reduce作为其子部分。排序是一项代价高昂的事情。在MapReduce编程中，reducer中的洗牌和排序阶段的目的是什么？最佳答案首先shuffling是将数据从mappers传输到reducers的过程，所以我认为这对reducers来说是必要的，否则他们将无法有任何输入(或来自每个映射器的输入)。洗牌甚至可以在映射阶段完成之前开始，以节省一些时间。这就是为什么本地图状态尚未达到100%时，您会看到减少状态大于0%(但小于33%)的原因。排序为reducer节省时间

牌和 Programming section reduce code sorting hadoop mapreduce hdfs shuffle

android - RxJava : Reduce or Combine or Merge

我想做的是查询联系人的AndroidContentProvider。返回的Cursor包含一个联系人的多个副本，其中他们可能有多个号码注册到他们的contact_id)到目前为止，我已经查询了数据库，并且正在遍历游标行。我map()这些行并将它们转换为ValueObjects接下来我想遍历所有VO列表并合并具有相同contact_id的那些(VO将存储一个标签和数字数组)但是，我被卡住了，我不知道如何执行最后一部分，我如何循环遍历ValueObjects列表，将重复项合并为一个，然后处理不需要的。这是ContentProvider返回的Cursor示例:86{_id=5190conta

android Combine contact code final rx-java

android - 无法启动模拟器 : "Emulator: Warning: requested RAM 1024M too high for your system. Reducing to maximum supported size 0M"

我相信这是因为我更新了我的SDK和工具，但没有更新HAXM。不幸的是，我在这台机器上没有管理员权限，需要帮助弄清楚如何在不更新HAXM的情况下让模拟器工作。有任何想法吗？降级SDK？也许获得新的HAXM是前进的唯一选择？9:55AMEmulator:Warning:requestedRAM1024Mtoohighforyoursystem.Reducingtomaximumsupportedsize0M9:55AMEmulator:Processfinishedwithexitcode0 最佳答案重新安装HAXM并恢复业务。我认为

amp requested section HAXM Emulator android sdk emulation intel

android - 在 MVI 中访问 reducer 函数之外的状态

在带有Mosby库的MVI中，访问流中reducer函数之外的状态的最佳方法是什么？例如，当您需要为回收站加载下一页时，您需要知道最后加载的是哪一页。(在示例应用程序中，最后一页保存在加载程序中，但这违背了拥有单一状态POJO的全部目的) 最佳答案有多种方法可以做到这一点，并且根据您的分页url的构造方式，您可能根本不需要引用私有(private)状态。例如，假设您可以通过数字访问下一页。所以http请求看起来像这样:http://www.foo.com/feed?page=1下一页是http://www.foo.com/feed

android reducer code section previousPage architecture mosby

Android 媒体编解码器 : Reduce mp4 video size

我正在寻找一种“压缩”mp4视频的方法。为此，我想降低视频的分辨率和/或降低FPS。经过长时间的研究，我认为这样做的方法是使用MediaCodec和相关的API，如下所示:->MediaExtractor从mp4文件中提取编码的媒体数据。->MediaCodec(Decoder):解码每一帧以供后续处理。->MediaCodec(编码器):在这一点上，我想这是我们应该建立MediaFormat参数(例如视频分辨率)的地方，这应该有助于我们减少mp4文件的最终大小。->用于生成mp4文件的MediaMuxer(MinSDK18，这可能是个问题，但现在......好的)。我不想使用Surf

Android Reduce section code mediacodec video resolution mp4 android-mediacodec