草庐IT

期末作业

全部标签

hadoop MapR2 作业无操作

ayush@ayush-Inspiron-3521:~/apps/h260$jps3474ResourceManager3603NodeManager3316SecondaryNameNode3957Jps3129DataNode2975NameNodeayush@ayush-Inspiron-3521:~/apps/h260$bin/hdfsdfs-mkdir/userayush@ayush-Inspiron-3521:~/apps/h260$bin/hdfsdfs-mkdir/user/ayushayush@ayush-Inspiron-3521:~/apps/h260$bin/h

java - MapReduce 作业因 ExitCodeException exitCode=255 而失败

我正在尝试运行需要共享库(.so文件)的MapReduce作业。如果我使用独立Java程序中的共享库,我根本没有问题(该程序使用java.library.path来查找库),但是如果我尝试使用MapReduce程序中的相同native方法,那么我获取我在下面粘贴的异常(对于我使用分布式缓存的MapReduce程序)。我知道实际上正在加载native库并且从MapReduce调用native代码(C++),因为native函数将某些内容打印到标准输出,但在native函数返回后我看到一个“信号被捕获,正在退出"消息,然后应用程序日志仅提供以下信息(我认为255在这种情况下是-1)但仅此而

hadoop - 运行 Map Reduce 作业显示错误 - Mkdirs 无法创建/var/folders/

当我在Mac终端中运行mapreduce作业时:PawandeepSingh1$hadoopjarMaximumTemperature.jarExceptioninthread"main"java.io.IOException:Mkdirsfailedtocreate/var/folders/v1/lyx_f0rj615cy8s54_bk053h0000gp/T/hadoop-unjar3698429834837790177/META-INF/licenseatorg.apache.hadoop.util.RunJar.ensureDirectory(RunJar.java:128)a

hadoop - 如果输入数据源在 HDFS 中不断增加,MapReduce 作业会发生什么情况?

我们有一个与HDFS一起运行的日志收集代理,即代理(如Flume)不断收集一些应用程序的日志,然后写入HDFS。读写过程不停地运行,导致HDFS的目标文件不断增加。这里的问题是,由于输入数据不断变化,如果我将收集代理的目标路径设置为作业的输入路径,MapReduce作业会发生什么情况?FileInputFormat.addInputPath(job,newPath("hdfs://namenode:9000/data/collect")); 最佳答案 map-reduce作业仅处理开始时可用的数据。Map-Reduce用于批量数据处

hadoop - 通过 socks 代理将 YARN 作业提交到远程 Hadoop 集群

我正在尝试通过SOCKS代理访问运行YARN的防火墙Hadoop集群。集群本身没有使用代理连接——只有我在本地机器(例如笔记本电脑)上运行的客户端通过ssh-D9999user@gateway-host连接到可以看到Hadoop的机器簇。在Hadoop配置core-site.xml(在我的笔记本电脑上)中,我有以下几行:hadoop.socks.serverlocalhost:9999hadoop.rpc.socket.factory.class.defaultorg.apache.hadoop.net.SocksSocketFactory以这种方式访问​​HDFS效果很好。但是,当我

人工智能期末复习——速通知识点

知识点是通过老师上课ppt整理,对于期末复习的基本考点都有涉及,以及计算题部分都有例题进行讲解,希望能帮助大家更好的复习。人工智能期末复习人工智能一、绪论二、知识表示与知识图谱三、确定性推理四、不确定性推理方法五、搜索求解策略六、机器学习人工智能一、绪论智能的主要流派:思维理论:智能的核心是思维知识阈值理论:智能取决于知识的数量及一般化程度进化理论:用控制取代知识的表示智能的特征:感知能力记忆与思维能力逻辑思维(抽象思维)依靠逻辑进行思维。思维过程是串行的。容易形式化。思维过程具有严密性、可靠性。形象思维(直感思维)依据直觉。思维过程是并行协同式的。形式化困难。在信息变形或缺少的情况下仍有可能

hadoop - 运行 Oozie 作业

我正在尝试配置Oozie以在我的hadoop-2.7.1集群上工作。一切似乎都运行良好,YARN、Hue、MapReduce和Spark。通过yarnjar...命令发送的作业正确完成,但通过CLIooziejob...-run或Hue发送一些带有oozie的作业,作业是停留在33%,节点日志显示:2015-11-0606:08:56,121INFO[main]org.apache.hadoop.yarn.client.RMProxy:ConnectingtoResourceManageratlocalhost/127.0.0.1:180302015-11-0606:08:57,165

snappy 文件上的 hadoop python 作业产生 0 大小的输出

当我在文本文件上使用hadoop流运行wordcount.py(pythonmrjobhttp://mrjob.readthedocs.org/en/latest/guides/quickstart.html#writing-your-first-job)时,它会给我输出,但是当对.snappy文件运行相同的命令时,我得到的输出大小为零。尝试过的选项:[testgenword_count]#catmrjob.confrunners:hadoop:#thiswillworkforbothhadoopandemrjobconf:mapreduce.task.timeout:3600000#

Hadoop 集群。 Map reduce 作业停留在 map 100% 和 reduce 0%

我是Hadoop新手。我尝试根据ApacheHadoopsite上给出的示例创建一个hadoop集群。.但是,当我运行mapreduce示例时,应用程序卡在map100%和reduce0%。请帮忙我已经使用Vagrant和Virtualbox设置了环境。创建了两个实例。我在一个实例中运行名称节点和数据节点,在另一个实例中运行资源管理器和节点管理器。mapred-siet.xml配置mapreduce.framework.nameyarnmapreduce.map.memory.mb1536mapreduce.map.java.opts-Xmx1024Mmapreduce.reduce.

python - 在没有 PuTTy/SSH 的情况下通过 Python 启动 Hadoop MapReduce 作业

我一直在通过PuTTy登录SSH来运行HadoopMapReduce作业,这需要我在PuTTY中输入主机名/IP地址、登录名和密码才能获得SSH命令行窗口。进入SSH控制台窗口后,我会提供适当的MR命令,例如:hadoopjar/usr/lib/hadoop-0.20-mapreduce/contrib/streaming/hadoop-streaming-2.0.0-mr1-cdh4.0.1.jar-file/nfs_home/appers/user1/mapper.py-file/nfs_home/appers/user1/reducer.py-mapper'/usr/lib/py