草庐IT

防丢失

全部标签

hadoop - xml 在 jobtracker 日志中丢失错误

我在我们的hadoopjobtracker日志中看到了很多这样的错误,任何人都可以对此有所了解吗?集群是CDH4.2,带有单个jobtracker和MRV1。这是错误:2014-05-1322:43:40,987INFOorg.apache.hadoop.mapred.TaskInProgress:Errorfromattempt_201405081738_82268_m_000016_0:Errorinitializingattempt_201405081738_82268_m_000016_0:org.apache.hadoop.util.DiskChecker$DiskError

database - 有没有办法在不丢失数据的情况下重命名配置单元表?

我想重命名我已经使用配置单元创建的表。有什么方法可以在不丢失数据的情况下重命名这些表? 最佳答案 你应该试试这个ALTERTABLEdatabase.table_to_renamerenametonew_table_name; 关于database-有没有办法在不丢失数据的情况下重命名配置单元表?,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/36500657/

java - 丢失节点上的 Hadoop 容器清理超时

我在多节点集群上工作,有四个从节点命名为slave01、slave02、slave03和slave04,一个主节点作为master当我在map任务hadoop中拔掉网线时等待状态更新100秒(由于其值为100000的属性)在那之后我可以看到maptask失败并且hadoop启动容器清理需要超过10分钟并且它也不会在任何地方安排失败的任务。我收到错误消息没有路由到主机异常从应用程序主机到丢失的节点.之后任务在另一个节点上获得调度。我想减少尝试容器清理的时间,以便可以在任何节点上的maptask超时后立即安排任务。请帮助我如何通过设置配置来做到这一点。我附加了应用程序主日志,其中我在map

apache - Zookeeper 报错连接丢失异常

我正在亚马逊EC2实例上运行SeqWareVM我正在​​尝试使用SeqWare查询引擎从VCF文件中查询数据。当我第一次启动实例并按照说明导入数据时,它工作正常,并继续工作直到我停止实例。当我重新启动它时。它不会让我导入任何东西,也不会创建新的工作区。它总是返回以下错误。我查看了这些进程,发现所需的节点都没有运行,所以我登录到root并转到etc/init.d目录并重新启动所有内容,此时,当T尝试导入数据,我什至没有收到错误,我必须停止该过程。[seqware@mastertarget]$java-classpathseqware-distribution-0.13.6.7-qe-fu

Hadoop 日志文件丢失

来自较旧版本的Hadoop,我正在寻找Hadoop2.2.0中的用户日志文件(log.index、stderr、stdout、syslog)。我首先查找Web界面,但在端口50030上没有任何运行。然后我查看了HADOOP_HOME_DIR/logs,但没有看到userlogs目录,也没有看到带有作业编号的内容。我查看的下一个位置是临时目录(/tmp),并找到看起来像它的文件夹:$find.-name"job_local1643076800_0001"./hadoop-tom/mapred/staging/tom1643076800/.staging/job_local16430768

hadoop - Hortonworks HDP ambari AWS EC2 心跳丢失

在AWSEC2上成功部署HDP集群。重启HDP集群节点后,ambari服务器的心跳丢失,因为所有公共(public)和私有(private)IP以及DNS都已更改。在ambari服务器中我们可以在哪里配置新的IP或DNS?? 最佳答案 首先,Ambari要求所有节点都有FQHN。最佳做法是在所有节点上分配正确的主机名。在您的Ambari服务器上恢复心跳的一个简单的方法是在您的所有客户端节点上运行以下命令:sudoambari-agentrestartyour_ambari.server.hostname.com它在Ambari2.0

java - 由于某些未知原因,Spark 作业在 saveAsHadoopDataset 阶段失败,因为执行器丢失

我有一个在yarn上运行的spark作业,它处理大约150gb的数据集,并进行多次随机播放操作,最后将数据存储到hbase中。它在saveAsHadoopDataset处一直失败基本上,多个执行程序在报告高GCActivity后在此阶段失败。但是,执行程序日志、驱动程序日志或节点管理器日志均未指示任何OutOfMemory错误或GCOverheadExceeded错误或超出内存限制错误。我在sparkui中也没有看到执行器失败的任何其他原因。valhConf=HBaseConfiguration.createhConf.setInt("hbase.client.scanner.cach

hadoop - Confluent HDFS 连接器正在丢失消息

社区,您能帮我理解为什么~3%的消息没有在HDFS中结束吗?我用JAVA编写了一个简单的生成器来生成1000万条消息。publicstaticfinalStringTEST_SCHEMA="{"+"\"type\":\"record\","+"\"name\":\"myrecord\","+"\"fields\":["+"{\"name\":\"str1\",\"type\":\"string\"},"+"{\"name\":\"str2\",\"type\":\"string\"},"+"{\"name\":\"int1\",\"type\":\"int\"}"+"]}";publi

hadoop - 如何在 pig latin 的日期时间范围内创建丢失的记录

我有表单的输入记录2013-07-09T19:17Z,f1,f22013-07-09T03:17Z,f1,f22013-07-09T21:17Z,f1,f22013-07-09T16:17Z,f1,f22013-07-09T16:14Z,f1,f22013-07-09T16:16Z,f1,f22013-07-09T01:17Z,f1,f22013-07-09T16:18Z,f1,f2这些代表时间戳和事件。我手写了这些,但实际数据应该根据时间排序。我想生成一组记录,这些记录将输入到需要连续时间序列的绘图函数中。我想填写缺失值,即如果有“2013-07-09T19:17Z”和“2013-0

java -/conf 目录在 Hadoop 2.5.1 中丢失错误

我已经在我的系统上配置了Hadoop2.5.1。当我尝试启动节点时,出现错误:“找不到配置目录:/conf”,如下所示。hduser@System-Vaio:/usr/local/hadoop/sbin$./start-dfs.shIncorrectconfiguration:namenodeaddressdfs.namenode.servicerpc-addressordfs.namenode.rpc-addressisnotconfigured.Startingnamenodeson[]Error:Cannotfindconfigurationdirectory:/confErro