GetScheduled-Job

scala - Apache Spark : how to cancel job in code and kill running tasks?

我在客户端模式下使用Yarn(版本2.6.0)在Hadoop集群上运行Spark应用程序(版本1.6.0)。我有一段运行长时间计算的代码，如果它花费的时间太长，我想终止它(然后运行一些其他函数)。这是一个例子:valconf=newSparkConf().setAppName("TIMEOUT_TEST")valsc=newSparkContext(conf)vallst=List(1,2,3)//settingupaninfiteactionvalfuture=sc.parallelize(lst).map(while(true)_).collectAsync()try{Await.

hadoop - Druid 批量索引 inputSpec 类型粒度，错误为 "no input paths specified in job"

我正在按照此处编写的说明进行操作:http://druid.io/docs/0.9.2/ingestion/batch-ingestion.html(滚动到“InputSpecspecification”，寻找“granularity”)。我的索引任务JSON中有:"inputSpec":{"type":"granularity","dataGranularity":"DAY","inputPath":"hdfs://hadoop:9000/druid/events/interview","filePattern":".*","pathFormat":"'y'=yyyy/'m'=MM/

amp inputSpec 34 hadoop section indexing batch-processing druid granularity

尽管设置了 mapred.job.tracker 值，Hadoop 1.2.1 仍以本地模式运行

我正在尝试将giraph作业提交到hadoop1.2.1集群。该集群有一个名称节点主节点、一个映射归约主节点和四个从节点。作业失败，出现以下异常:java.util.concurrent.ExecutionException:java.lang.IllegalStateException:checkLocalJobRunnerConfiguration:使用LocalJobRunner时，必须只有一个worker，因为一次只有1个任务!但是，这是我的mapred-site.xml文件:mapred.job.trackerjob.tracker.private.ip:9001mapred

尽管 tracker gt lt property hadoop mapreduce olap gremlin giraph

hadoop - 从 spark master UI 清除 Spark Job 历史记录

我正在处理spark，我想通过清除所有以前失败/完成的作业来清除我的sparkmasterUI。我不知道该怎么做？我试过从hdfs中删除日志，但作业条目仍然显示在UI上。最佳答案您需要重新启动masterspark进程。来自spark的sbin目录，运行./stop-master.sh和./start-master.sh它应该修复。关于hadoop-从sparkmasterUI清除SparkJob历史记录，我们在StackOverflow上找到一个类似的问题：

hadoop master section code apache-spark hadoop-yarn spark-hive

hadoop - 提交拓扑后命令状态停止 "Creating job WordCountTopology"

我尝试使用ApacheMesos、ApacheAurora、ZooKeeper和HDFS构建Heron集群。但是，当我在完成后提交WordCountTopology时，命令输出如下:停止“创建作业WordCountTopology”。yitian@ubuntu:~/.heron/conf/aurora$heronsubmitaurora/yitian/devel--config-path~/.heron/conf~/.heron/examples/heron-api-examples.jarcom.twitter.heron.examples.api.WordCountTopology

命令状 WordCountTopology heron twitter hadoop apache-zookeeper mesos apache-storm-topology apache-aurora

hadoop - 运行hadoop example，遇到 ".staging/job_1541144755485_0002/job.splitmetainfo does not exist"，怎么办？

我的配置如下:Hadoop实验我用了两台机器，分别是pc720(10.10.1.1)和pc719(10.10.1.2)。jdk(版本1.8.0_181)由apt-get安装。Hadoop2.7.1下载自https://archive.apache.org/dist/hadoop/common/hadoop-2.7.1/,并放入/opt/第一步:我配置了/etc/bash.bashrc，添加了exportJAVA_HOME=/usr/lib/jvm/java-8-openjdk-amd64exportPATH=${JAVA_HOME}/bin:${PATH}exportHADOOP_HO

hadoop 1541144755485 gt lt property

amazon-web-services - 如何计算映射器/缩减器的数量，以最大限度地提高在亚马逊云上运行的 mahout Recommender Job 的性能？

根据AmazonElasticMapReduce上使用/可用的实例，计算要使用的正确hadoop映射器和缩减器数量的最佳方法是什么？(使用mahout-core-0.7发行版的RecommenderJob) 最佳答案通用的Hadoop答案适用:让Hadoop选择映射器的数量将reducer的数量设置为等于集群中reduce插槽的数量对于EMR，查看在您使用的实例类型上默认运行的reducer数量:http://docs.aws.amazon.com/ElasticMapReduce/latest/DeveloperGuide/Ha

射器缩减 section 的 amazon-web-services hadoop mahout reducers mapper

hadoop - 级联 2.0.0 作业在 hadoop FileNotFoundException job.split 上失败

当我在更大的数据集上运行我的作业时，许多映射器/缩减器失败导致整个作业崩溃。这是我在许多映射器上看到的错误:java.io.FileNotFoundException:Filedoesnotexist:/mnt/var/lib/hadoop/tmp/mapred/staging/hadoop/.staging/job_201405050818_0001/job.splitatorg.apache.hadoop.hdfs.DFSClient$DFSInputStream.openInfo(DFSClient.java:1933)atorg.apache.hadoop.hdfs.DFSCl

hadoop FileNotFoundException apache mapred cascading

hadoop - 亚马逊弹性 map 减少 : Job flow fails because output file is not yet generated

我有一个执行三项任务的AmazonEMR作业流程，第一项的输出是后续两项的输入。第二个任务的输出被第三个任务DistributedCache使用。我已经完全在EMR网站(控制台)上创建了作业流，但集群立即失败，因为它找不到分布式缓存文件-因为它尚未在步骤#1中创建。我唯一的选择是通过boostrap操作从CLI创建这些步骤，并指定--wait-for-steps选项吗？我无法执行一个任务的输入依赖于另一个任务的输出的多步骤作业流，这似乎很奇怪。最佳答案最后，我通过创建一个自举但没有任何步骤的AmazonEMR集群解决了这个问题。

generated because section stackoverflow 中创 hadoop amazon-emr

shell - Oozie Job 仍处于 RUNNING 状态

我正在尝试在HDP集群上运行简单的oozie作业。执行oozie后，job保持Running状态。这是我的Workflow.xml${jobTracker}${nameNode}sqoopimport--connectjdbc:mysql://localhost:3306/test--tabletesting--split-byerr_dt--hive-import--hive-tabletesting-m1hive-site.xmlmysql-connector-java.jarActionfailed以下是正在生成的日志..2015-04-0714:33:32,792INFOAct

处于 RUNNING oozie 150407125731126 oozie-oozi-W shell hadoop hive sqoop

30 31 323334 35 36