草庐IT

task_records

全部标签

ios - 进程启动失败 : failed to get the task for process 2847

当我使用Xcode7.2.1和iPadmini2进行调试时,Xcode显示此消息:processlaunchfailed:failedtogetthetaskforprocess2847 最佳答案 解决方案1:您是开发中的分发配置文件。如果您希望调试器链接到您的XCode,则需要使用开发配置文件。解决方案2:转到Xcode>Preferences>AccountTab>SelectAppleID>ViewDetails>RefreshButton(左下角)。重新启动Xcode。也许它会对你有所帮助。

Hadoop DBWritable : Unable to insert record to mysql from Hadoop reducer

插入表时遇到重复输入问题。我一直使用Hadoopmapper从文件中读取记录。它成功地从文件中完全读取记录​​。但是当通过Hadoopreducer将记录写入mysql数据库时,出现以下错误。java.io.IOException:键“PRIMARY”的重复条目“505975648”但是Mysql表仍然是空的。无法从HadoopDBWritablereducer将记录写入mysql表。错误日志如下:警告:com.mysql.jdbc.exceptions.jdbc4.MySQLNonTransientConnectionException:Connection.close()已被调用。

hadoop - 洗牌和排序后的 n-Records 到 reducer

我只想将排序/洗牌后输出的前10条记录移动到缩减程序。这可能吗?原因是这样的:我要在一个文件中找到数量最多的最少10项。但是,我知道映射阶段的结果将到达已经排序的reducer。因此,我不想在映射器中排序,而是只想将“洗牌和排序”之后的前10行传递给缩减器。这将允许reducer仅对原始记录的一个子集进行排序。有什么办法吗? 最佳答案 您可以通过为作业编写自定义Combiner来实现这一点。MapReduce作业的不同阶段是:Mapper->Partitioner->Sorting->Combiner->Reducer.现在Comb

hadoop - Spark 1.2 : Write single record into multiple files (blacklisted)

我尝试将RDD中的每条记录写入多个文件(每个黑名单一个,并按键分组)到HDFS,并在每个文件集上应用黑名单。首先,我将MultipleTextOutputFormat与keyBy结合使用,按记录中的字段对输出文件进行分组,效果很好。所以我的输出文件现在由一个键命名,来自记录,记录在这个文件中分组。但我现在的问题是,我需要在输出上应用黑名单并分别保存这些输出中的每一个。我使用一个简单的过滤器做到了这一点。现在发生的情况是,应用此文件管理器会导致作业针对x个不同的黑名单完成X次。对于大量记录,这是NotAcceptable。即使之前在Dataframe上调用缓存函数。为了弄清楚我想要什么,

Hadoop MapReduce : How to ensure multiple tasks are executed in parallel among all nodes

我在HDFS中有一个任务列表文件,任务列表受CPU限制,将在带有HadoopMapReduce(仅限Map)的小型5节点集群中执行。例如,任务列表文件包含10行,每行对应一个任务命令。每个任务的执行都需要很长时间,所以在所有5个节点上并行执行列出的10个任务肯定更高效。但是由于任务列表文件很小,这个数据block很可能只位于一个节点上,所以根据数据局部性原则,只有该节点会执行所有这10个任务。有什么解决方案可以确保所有10个任务在所有5个节点上并行执行? 最佳答案 默认情况下,mapreduce将在每次拆分时运行一个映射器。拆分是一

hadoop - 如何解决错误 "file:/user/hive/warehouse/records is not a directory or unable to create one"?

hive>CREATETABLErecords(yearSTRING,temperatureINT,qualityINT)>ROWFORMATDELIMITED>FIELDSTERMINATEDBY'\t';FAILED:ExecutionError,returncode1fromorg.apache.hadoop.hive.ql.exec.DDLTask.MetaException(message:file:/user/hive/warehouse/recordsisnotadirectoryorunabletocreateone)如何解决错误?/user/hive/warehous

hadoop - 亚马逊弹性 MapReduce : the number of launched map task

在MapReduce作业流程步骤的“系统日志”中,我看到以下内容:JobCountersLaunchedreducetasks=4Launchedmaptasks=39启动的maptask数是否包含失败的任务?我使用NLineInputFormat类作为输入格式来管理maptask的数量。但是,对于完全相同的输入,我偶尔会得到略有不同的数字,或者取决于实例的数量(10、15和20)。谁能告诉我为什么我看到启动的任务数量不同? 最佳答案 这很可能是推测性执行的启动。当Hadoop有可用资源时,它可能会选择同时运行同一任务的两次尝试。启

java - 即使在命令行上告诉为 -D mapred.reduce.tasks=0 后,hadoop reduce 任务仍在运行

我有一个MapReduce编程为publicstaticclassMapClassextendsMapReduceBaseimplementsMapper{privatefinalstaticIntWritableuno=newIntWritable(1);privateIntWritablecitationCount=newIntWritable();publicvoidmap(Textkey,Textvalue,OutputCollectoroutput,Reporterreporter)throwsIOException{citationCount.set(Integer.par

Hadoop 映射减少 : Order of records while grouping

我在每行输入中都有一条记录,每条记录大约有10个字段。首先,我按三个字段(field1,field2,field3)对记录进行分组,因此一个mapper/reducer负责一个唯一的组(基于三个字段)。在每个组中,我根据另一个整数字段timestamp对记录进行排序,并通过添加另一个字段用相同的标签aTag标记组中的每个记录。假设在mapper#1中,我将一个排序组标记为aTag,在mapper#2中,我标记了另一个组(一个不同的组,因为我最初根据三个字段对记录进行了分组)具有相同的标签aTag。现在,如果我根据标签字段对记录进行分组(即,在不同的映射器中对组进行分组),我注意到每个组

hadoop - 如果压缩类型是 RECORD 而不是 block ,我们是否需要创建一个索引文件(使用 lzop)?

据我所知,需要一个索引文件来使输出可拆分。如果mapred.output.compression.type=SequenceFile.CompressionType.RECORD,还需要建立Index文件吗? 最佳答案 简答:RECORD和BLOCKcompression.type属性适用于序列文件,不适用于简单的文本文件(可以使用lzo或gzip或bz2独立压缩...)更多信息:LZO是一种压缩编解码器,它提供比gzip更好的压缩和解压缩速度,并且还具有拆分功能。LZO允许这样做,因为它由许多较小的(~256K)压缩数据block