vm_enough_memory

单节点 vagrant VM 上的 Hadoop - 启动 start-all.sh 时连接被拒绝

我创建了一个vagrant虚拟机并在上面安装了hadoop。只有一个服务器集群。但是当我尝试在机器上启动我的hadoop时，出现以下错误:mkdir:从master/127.0.1.1到localhost:9000的调用在连接异常时失败:java.net.ConnectException:连接被拒绝；有关详细信息，请参阅:http://wiki.apache.org/hadoop/ConnectionRefused还有想法？该机器被命名为master。服务器是Ubuntu。谢谢! 最佳答案这是因为hdfs节点没有运行goto,cd

memory - Hadoop 名称节点内存使用情况

我对hadoopnamenode内存问题感到困惑。当namenode内存使用率高于一定百分比(比如75%)时，通过hadoopapi读写hdfs文件会失败(比如调用一些open()会抛出异常)，请问是什么原因？有没有人有同样的事情？PS.这次namenode的diskio不高，CPU比较空闲。什么决定了namenode的QPS(每秒查询数)？非常感谢! 最佳答案因为名称节点基本上只是一个管理HashMap的RPC服务器对于这些block，您有两个主要的内存问题:JavaHashMap成本很高，它的冲突解决(单独的链接算法)也很昂贵

memory Hadoop namenode code section distributed-computing

Hadoop:为什么我在 Namenode Information Web 中收到 "Max Non Heap Memory is -1 B."消息？这是什么意思？

我有一个使用VirtualBox制作的Hadoop2.6.5集群(一个主节点用作名称节点和数据节点，两个从节点)(easch节点安装了Xubuntu16.04)。先验，安装是正确的，因为我运行了一个wordcount示例并且没问题。在master:50070(我看到名称节点信息的地方)，我得到这个:"MaxNonHeapMemoryis-1B."你知道这是什么意思吗？我找不到答案，我想检查一下，因为在运行wordcount之后我尝试运行我自己的程序但它没有成功，尽管它在我的Hadoop单节点安装中运行正常。我希望清楚，如果您需要更多信息，请告诉我。谢谢! 最

Information amp section Hadoop 中运 virtualbox cluster-computing heap-memory namenode

hadoop - 在 Cloudera VM 中将数据从 HDFS 加载到 Hive Table

当使用ClouderaVM时，您如何访问HDFS中的信息？我知道没有到HDFS的直接路径，但我也不知道如何动态访问它。通过HiveCLI创建Hive表后，我尝试从位于HDFS中的文件加载一些数据:loaddatainpath'/test/student.txt'intotablestudent;但是我得到了这个错误:FAILED:SemanticExceptionLine1:17Invalidpath''/test/student.txt'':Nofilesmatchingpathhdfs://quickstart.cloudera:8020/test/student.txt我还尝试将

Cloudera hadoop code HDFS section hive cloudera-cdh cloudera-quickstart-vm

memory - 如何更改 EMR hadoop 流作业中的内存

我正在尝试克服EMR上的hadoop流作业中的以下错误。Container[pid=30356,containerID=container_1391517294402_0148_01_000021]isrunningbeyondphysicalmemorylimits我尝试搜索答案，但我找到的那个没有用。我的工作启动如下所示。hadoopjar../.versions/2.2.0/share/hadoop/tools/lib/hadoop-streaming-2.2.0.jar\-inputdeterminations/part-00000\-outputdeterminations/

memory hadoop section code streaming emr

hadoop - Cloudera CDH VM 默认 HADOOP_HOME 位置

ClouderaCDH4VM中的默认HADOOP_HOME位置是什么。echo$HADOOP_HOME返回空白。最佳答案 /usr/lib/hadoop是CDH4中的默认HADOOP_HOME。关于弃用，HADOOP_PREFIX似乎是HADOOP_HOME的替代品:$HADOOP_HOMEisdeprecated我相信HADOOP_MAPRED_HOME仅用于mapreduce基础设施，如果您直接使用HDFS，那么您可能需要HADOOP_PREFIX。关于hadoop-Cloude

HADOOP_HOME Cloudera code HADOOP section

scala - 当我尝试通过 Cloudera VM 在 spark 中运行 scala 命令时，topology.py 出现语法错误

每次我尝试按照Scala命令运行valdataRDD=sc.textFile("hdfs://quickstart.cloudera:8020/user/cloudera/data/data.txt")dataRDD.collect().foreach(println)//ordataRDD.count()我得到以下异常-exitCodeExceptionexitCode=1:File"/etc/hadoop/conf.cloudera.yarn/topology.py",line43printdefault_rack^SyntaxError:Missingparenthesesinc

中运 scala section Cloudera hadoop pyspark cloudera-cdh cloudera-quickstart-vm

memory-management - HBase MemStore 和垃圾收集

我是HBase的新手，但我已经设置好HBase和Hadoop并了解一些相关知识。当我研究HBaseMemStore时，我对MemStore的全部了解是“MemStore是HBase放置必须写入或读取的数据的内存位置”。所以，这就是为什么我们想在何时何地阅读有关memstore的内容时，我们也会看到有关垃圾收集的讨论。现在我的问题是，memstore的唯一目的是在内存中保存可读和可写的数据吗？我们可以调整该内存的大小以获得hbase的快速回复吗？垃圾收集配置(收集器配置)会影响内存库吗？我认为应该是的。:) 最佳答案关于HbaseM

memory-management management section HBase memstore hadoop

ubuntu - 在 vmware 中从我的 ubuntu 运行 kafka 时无法识别的 VM 选项 '+UseCompressedOops'

我正在使用VMware使用ubuntu我已经在其中安装了hadoop单节点集群。然后我安装了zookeeper并运行了zookeeper。然后当我运行我的“Apachekafka”时它会抛出一个错误。无法识别的VM选项“+UseCompressedOops”无法创建Java虚拟机single@ubuntu:~/yoga/zookeeper-3.4.5/bin$./zkServer.sh开始默认启用JMX使用配置:/home/single/yoga/zookeeper-3.4.5/bin/../conf/zoo.cfg正在启动zookeeper...已启动single@ubuntu:~/

ubuntu amp strong zookeeper UseCompressedOops hadoop apache-zookeeper apache-kafka

hadoop - 使用主机系统上的客户端访问在 VM 中运行的 HBase

我尝试用客户端程序将一些数据写入hbaseHBase@Hadoop在Cloudera@ubuntu的预配置虚拟机中运行。客户端在托管虚拟机的系统上运行，并直接在虚拟机中运行客户端。所以现在我想用vm外的client访问vm上的server我正在使用NAT。为了能够访问HBaseMaster、HUE等服务器，在虚拟机上运行我在虚拟框中配置了端口转发:因此我可以访问HBaseMaster、HUE的概览站点。在我创建的虚拟机上针对服务器运行客户端hbase-site.xml内容:hbase.zookeeper.quorumlocalhosthbase.zookeeper.property.c

中运 hadoop ClientCnxn zookeeper property hbase virtualbox cloudera