working-copy

hadoop - HTTP ://localhost:50070/web UI doesn't work

我也在使用最新版本的Hadoop和java。在为hadoop的各个构建block(HDFS、mapreduce、yarn)配置所有文件后，我格式化了名称节点并发送了以下命令sbin/start-all.sh回车后，我在firefox浏览器输入http://localhost:50070/.我收到“无法连接”错误。我如何访问hadoop的WebUI。注意:我目前使用的是Ubuntu18.04 最佳答案 Hadoop的更高版本，即3.x.x；50070已更改为9870。所以，在浏览器中输入本地主机:9870

hadoop - 错误 2103 : doing work on Longs

我有数据storetrn_datedept_idsale_amt12014-12-151011000765512014-12-151011000765412014-12-151011000754462014-12-1510410008654482014-12-14101100000082014-12-15101100865761我正在尝试使用以下代码聚合数据-加载数据(尝试使用HCatLoader()和PigStorage()两种方式)data=LOAD'data'USINGorg.apache.hcatalog.pig.HCatLoader();group_table=GROUPda

hadoop doing apache java apache-pig

RLive : Only simple `select` works?

我在CentOS(Linux2.6.32-431.5.1.el6.x86_64)上使用Hadoop2.2.0.2.0.6.0-101运行RHive(https://github.com/nexr/RHive)RHive可以进行基本的select查询:rhive.query("select*fromsimple")并且RHive无法执行带条件的查询。例如:rhive.query("select*fromsimpleorderbyrating")Error:java.sql.SQLException:Errorwhileprocessingstatement:FAILED:Executio

simple select section code blockquote r hadoop

java - 在 Horton Works 沙盒上运行 Modified Wordcount 程序时需要帮助。

我在运行修改版的Wordcount程序时遇到错误(添加了映射器逻辑以将符号与单词分开)。错误:java.lang.RuntimeException:java.lang.ClassNotFoundException:类wcount.WordCount$TokenizerMapper操作系统:HortonWorksSandboxhosting2.6Hadoop版本这是我所做的-修改Wordcount.java以引入映射器逻辑使用命令编译了Wordcount.javajavac-classpath/home/test_user/jars/commons-cli-1.2.jar:/home/t

Wordcount Modified code IntWritable hadoop java jar word-count hortonworks-data-platform

multithreading - 50 个线程限制后的 NetBeans 探查器 "stops working"？

我正在尝试使用NetBeans7.1探查器来探查运行一系列hadoop任务(本地、单进程)的程序，但每个任务都是在单独的线程中启动的。我已将我的根方法设置为我正在使用的Mapper和Reducer的map和reduce方法，但似乎在线程50之后，netbeans分析器就停止了分析。它无法识别何时再次调用根方法。实时结果停止，我最后得到的快照似乎只包含前几个任务的数据。有谁知道为什么会发生这种情况或如何解决？谢谢最佳答案我找到了。在高级设置下有一个“LimitNumberofProfiledThreads”设置，默认设置为32

multithreading amp section stackoverflow questions netbeans hadoop profiler

hadoop - completebulkload 执行 'copy' StoreFiles 而不是 'cut'

我使用HBase完全批量加载将ImportTsv的输出传输到HBase中的表，我注意到它复制输出而不是剪切。对于我千兆字节的数据，这需要很长时间。在HBase文档(http://hbase.apache.org/book/ops_mgt.html#completebulkload)中，我读到文件将被移动而不是复制。谁能帮我解决这个问题？我使用Hbase0.94.11和Hadoop1.2.1。bulkload的文件系统输出目录和hbase集群也是一样的。我还使用HFileOutputFormat编写了一个MapReduce作业。当我使用LoadIncrementalHFiles将作业的输

amp completebulkload hbase section apache hadoop mapreduce hdfs

hadoop - MrJob 花费大量时间 Copy local files into hdfs

我遇到的问题是:已经将我的input.txt(50MBytes)文件放入HDFS，我正在运行python./test.pyhdfs:///user/myself/input.txt-rhadoop--hadoop-bin/usr/bin/hadoopMrJob似乎花了很多时间将文件复制到hdfs(又是？)Copyinglocalfilesintohdfs:///user/myself/tmp/mrjob/test.myself.20150927.104821.148929/files/这符合逻辑吗？它不应该直接从HDFS使用input.txt吗？(使用Hadoop版本2.6.0)

hadoop MrJob code section myself hdfs

hadoop - LAN 虚拟机上的 Web 应用程序 : curl -L works from other vms, 浏览器/主机上的 curl 没有

我正在我的LAN上设置Hadoop虚拟机集群，其中一个虚拟机(ResourceManager)上的进程提供了一个表现出奇怪行为的WebUI。所有虚拟机都从我的桌面运行，并已分配ips。我定位的URL是resourcemanager:8088，这是行为。从我桌面上运行的其他虚拟机:curl-vresourcemanager:8088返回HTTP302Found响应，Location:http://resourcemanager:8088/cluster。向上看，我看到这是一个重定向，curl-Lresourcemanager:8088成功检索到HTML。从运行虚拟机的桌面:尝试从(Chr

机上 curl code resourcemanager section hadoop networking port hadoop-yarn

Hadoop FileUtil.copy 签名

在Hadoop2.2.0(hadoop-common)中，我看到了FileUtil.copy的以下签名和文档:/**CopyfilesbetweenFileSystems.*/publicstaticbooleancopy(FileSystemsrcFS,Pathsrc,FileSystemdstFS,Pathdst,booleandeleteSource,Configurationconf)throwsIOException{我应该如何处理boolean和同时发生的IOException？是否打算根据对IOException的具体理解来区分两类可能的错误？在源代码中，使用falsei

FileUtil Hadoop code java noreferrer hadoop2

hadoop - 收到警告 ipc.Client : interrupted waiting to send params to server when copying files to HDFS

我写了一个perl脚本，其中调用了copyFromLocal来上传文件。当它运行时，WARNipc.Client:interruptedwaitingtosendparamstoserver发生。我检查了刚刚上传的HDFS上的所有文件。看来都复制成功了。谁知道那个警告是什么意思？完整的警告信息12/10/2311:41:07WARNipc.Client:interruptedwaitingtosendparamstoserverjava.lang.InterruptedExceptionatjava.util.concurrent.locks.AbstractQueuedSynchro

interrupted to java apache hadoop hdfs

134 135 136137138 139 140