草庐IT

hadoop - 是什么导致 Hadoop 数据节点死亡?

我一直在运行Hadoop2.3.0集群,我注意到状态页面(:50070/dfshealth.html)显示每隔几天就会发生一次死亡的数据节点。注意到数据节点故障后,我使用以下命令重新启动进程:/usr/local/hadoop/sbin/hadoop-daemon.shstopdatanode&&/usr/local/hadoop/sbin/yarn-daemon.shstopnodemanager&&/usr/local/hadoop/sbin/hadoop-daemon.shstartdatanode&&/usr/local/hadoop/sbin/yarn-daemon.shst

hadoop - 大型 MapReduce 作业不断死亡

我正在尝试在~10TBHBase表上运行MapReduce作业,该表具有TableMapper的子类。它基本上重写了整个表。输出配置如下:FileOutputFormat.setOutputPath(job,tablePath);TableMapReduceUtil.initTableMapperJob(inputTableName,tblScanner,ResaltMapper.class,ImmutableBytesWritable.class,//outputKeyClass,KeyValue.class,//outputValueClass,job);HFileOutputFo

hadoop - 区域服务器死亡的原因

我有一个在亚马逊Ec2上运行的3节点hbase集群。哪个工作得很好。现在,我尝试使用两个单独的插入查询将数据从EMR插入到EC2。所以首先插入查询工作得很好并插入数据,然后我所有的区域服务器都死了。那么,您能否建议我调试此问题的一般准则以及为什么区域服务器通常会死机?此外,即使我在一段时间后再次明确地启动区域服务器,它们也会死掉。更新问题:早些时候我认为这可能是一个问题,因为HBASE_HEAPSIZE默认设置为1GB。但我也将其增加到5.5Gb,但区域服务器仍处于死机状态。以下是我在每个区域服务器死后获得的日志。2013-10-0718:16:27,949WARNorg.apache

exception-handling - 如何处理在 map/reduce 期间死亡的数据节点

当map/reduce使用的数据节点出现故障时会发生什么?不应该将作业重定向到另一个数据节点吗?我的代码应该如何处理这种异常情况? 最佳答案 如果datanode宕机,运行在该节点上的任务(假设您也将其用作tasktracker)将失败,这些失败的任务将被分配给其他tasktracker以重新执行。在死数据节点中丢失的数据block将在其他数据节点中可用,因为将跨集群复制数据。因此,即使数据节点出现故障,除了重新执行失败任务的非常短暂的延迟外,不会有任何损失。所有这些都将由框架来处理。您的代码无需担心这一点。

networking - Hadoop 节点在一段时间后死亡(崩溃)

我有一个包含16个(ubuntu12.04服务器)节点(1个主节点和15个从节点)的hadoop集群。它们通过私有(private)网络连接,master也有一个公共(public)IP(它属于两个网络)。当我运行小任务时,即小输入和小处理时间,一切正常。然而,当我运行更大的任务时,即输入数据为7-8GB时,我的从属节点开始一个接一个地死掉。从网络用户界面(http://master:50070/dfsnodelist.jsp?whatNodes=LIVE)我看到最后一个联系人开始增加,从我的集群提供商的网络用户界面,我看到节点崩溃了。这是一个节点的屏幕截图(我无法向上滚动):另一台机

android - PackageManager 死亡 - DeadObjectException - 小包裹交易失败

我有一个非常简单的函数,如下所示:publicstaticbooleanisAppInstalled(StringpackageName){PackageManagerpm=MainApp.get().getPackageManager();try{pm.getPackageInfo(packageName,PackageManager.GET_ACTIVITIES);returntrue;}catch(PackageManager.NameNotFoundExceptione){returnfalse;}}有时这会在具有以下堆栈跟踪的getPackageInfo行崩溃:java.la

Android:进程已经死亡 - 资源不足?

我编写的一个简单的HTTPGET请求有点问题,它会每隔X分钟请求一个URL。我每天遇到一两次该进程在GET请求中停止的情况。这是调试日志的示例:12-0716:29:22.650V/TAG(11655):ExecutingHTTPRequest12-0716:29:25.336D/dalvikvm(11655):GC_CONCURRENTfreed366K,50%free2824K/5639K,external0K/0K,paused3ms+3ms12-0716:29:25.526D/dalvikvm(11655):GC_CONCURRENTfreed450K,52%free2825K

android - GCM 消息死于 "Accepted."的无声死亡

概念性问题,如果你不介意的话。我们面临着让GCM通知始终如一地传送到我们的Android应用程序的挑战,并且已经对代码的几乎所有方面进行了检查以发现没有任何问题。然而,许多消息只是在状态=“已接受”时结束它们的生命。我可以确认正确的gcm_tokens被打包并通过POST发送到https://gcm-http.googleapis.com/gcm/send大多数,但不是全部,他们都收到了。我可以确认这些消息的所有gcm_tokens都被GCMpost接收,因为我们正在记录生成的message_ids。但是message_id并不总是转化为呈现的通知。FWIW:我们没有覆盖delay_w

android - Android 上在整个应用程序 session 的 Activity 死亡/重启之间保存数据的最佳做法是什么?

我们正在设计一个Android应用程序,其中包含多个以类似向导的方式运行的Activity-用户应从Activity#1转到Activity#5以到达最终Activity(#6)。由于我们知道Activity可能会在内存不足的情况下被操作系统突然终止,因此我们使用Application类作为静态存储来保存用户在“向导”Activity中输入的数据以及我们的应用在整个session期间所需的其他数据。不幸的是,我们发现这种方法失败了——看起来Application类实例也可以被操作系统杀死(这是在Android1.6和1.5上特别发现的)。我们对这种方法的期望是否错误(我们认为Appli

Android - 进程已死亡问题

应用程序只是崩溃并在没有太多信息的情况下完成Activity。04-0113:30:43.739:W/AudioService(180):setMode()clientdied04-0113:30:43.739:W/GpsLocationProvider(180):Unneededremovelistenerforuid100004-0113:30:43.739:D/libloc(180):loc_eng_stopcalled04-0113:30:43.739:I/ActivityManager(180):Processcom.company.android(pid2590)hasdi