草庐IT

virtual-address-space

全部标签

hadoop - 错误配置 : namenode address dfs. namenode.servicerpc-address 或 dfs.namenode.rpc-address 没有配置

我正在尝试在ec2-instance上安装Hadoop-2.6.0。我下载并安装了Hadoop。我还设置了环境变量。尝试启动hdfs服务时出现以下错误。[ec2-user@ip-10-177-1-69sbin]$./start-dfs.sh配置不正确:namenode地址dfs.namenode.servicerpc-address或dfs.namenode.rpc-address没有配置。在[]上启动名称节点报错:找不到配置目录:/home/ec2-user/hadoop2.6.0/etc/hadoop报错:找不到配置目录:/home/ec2-user/hadoop2.6.0/etc

Hadoop 设置问题 : "ssh: Could not resolve hostname now.: No address associated with hostname"

我基于vmware搭建hadoop集群,使用sbin/start-dfs.sh命令,遇到ssh问题。它说,ssh:Couldnotresolvehostnamenow.:Noaddressassociatedwithhostname我已经使用vi/etc/hosts命令检查主机名和IP地址,以及vi/etc/profile命令。我保证没有错。 最佳答案 一些建议检查hdfs-site.xml中的主机名是否设置正确。如果您使用单主机设置运行,并且将名称节点主机设置为本地主机,则需要确保本地主机映射到/etc/hosts中的127.0.

regex - Hadoop Hive SerDe Row Format for String Quoted Space delimited file

我正在尝试为具有以下格式的日志文件创建一个Hive表。日志文件:#Software:1#Version:1#Start-Date:xx#Date:xx#Fields:datetimetime-takenc-ipcs-usernamecs-auth-groupx-exception-idsc-filter-resultcs-categoriescs(Referer)sc-statuss-actioncs-methodrs(Content-Type)cs-uri-schemecs-hostcs-uri-portcs-uri-pathcs-uri-querycs-uri-extensionc

vector - java.lang.OutOfMemoryError : Java heap space error while running seq2sparse in mahout 错误

我正在尝试在mahout中使用k-means对一些手工制作的日期进行聚类。我创建了6个文件,每个文件中几乎没有1或2个单词的文本。使用./mahoutseqdirectory从它们中创建一个序列文件。在尝试使用./mahoutseq2sparse命令将序列文件转换为向量时,出现java.lang.OutOfMemoryError:Javaheapspace错误。序列文件大小为0.215KB。命令:./mahoutseq2sparse-imokha/output-omokha/vector-ow错误日志:SLF4J:ClasspathcontainsmultipleSLF4Jbindin

hadoop - Mahout - 异常 : Java Heap space

我正在尝试使用以下方法将一些文本转换为mahout序列文件:mahoutseqdirectory-iLastfm-ArtistTags2007-oseqdirectory但我得到的只是一个OutOfMemoryError,如下所示:Runningonhadoop,using/usr/bin/hadoopandHADOOP_CONF_DIR=MAHOUT-JOB:/opt/mahout/mahout-examples-0.9-job.jar14/04/0716:44:34INFOcommon.AbstractJob:Commandlinearguments:{--charset=[UTF

Hadoop : HDFS space quota

有什么方法可以检查特定HDFS目录上是否应用了任何空间配额?我找不到任何提供此类信息的命令here 最佳答案 也许你错过了这个页面?https://hadoop.apache.org/docs/r2.7.1/hadoop-project-dist/hadoop-hdfs/HdfsQuotaAdminGuide.html#Administrative_CommandsanextensiontothecountcommandoftheHDFSshellreportsquotavaluesandthecurrentcountofnames

java - 运行 mapreduce 程序时出现 "Java Heap space Out Of Memory Error"

我在运行mapreduce程序时遇到内存不足错误。如果我将260个文件保存在一个文件夹中并作为mapreduce程序的输入,它会显示Java堆空间内存不足错误。如果我只提供100文件作为mapreduce的输入,它运行良好。那么我如何限制mapreduce程序一次只处理100个文件(~50MB)。任何人都可以就这个问题提出建议......Nooffiles:318,Noofblocks:1(blocksize:128MB),Hadoop运行在32位系统上MyStackTrace:==============15/05/0511:52:47INFOinput.FileInputForma

apache - 需要在 Virtual Box 5.0.16 中运行的 Hortonworks Sandbox 虚拟机(HDP 2.4)上安装 Firefox 浏览器

我是Hadoop和大数据世界的新手...我已经在VirtualBox中安装了HortonworksSandboxVM。效果很好……谁能告诉我如何在VM中安装Firefox?我需要它来使用NIFI非常感谢您的帮助! 最佳答案 在VM上安装浏览器并通过VNC使用它通常会非常慢。最好的选择是设置SSH隧道并进行本地转发。如果你在Windows上使用PuTTyssh客户端,那么你可以按照以下instructions进行操作关于设置本地转发,这将允许您使用主机操作系统上的浏览器连接到VM中运行的NIFI实例。

hadoop - Sqoop 导入失败 “No Space Left on Device”

Sqoop无法将数据导入hadoopthorwing错误为随机表上的“设备上没有剩余空间”。我们在HDFS和LocalFS上都有足够的空间。不知道为什么,请让我知道如何解决它。SELECTALTR_DESCWHERE1=1WITHUR2017-03-2900:32:27ERRORSqoopThread:165-ErroroccurredwhileimportingdataHALS.CLOUD_AESCjava.lang.RuntimeException:java.io.FileNotFoundException:/apps/data/cloud.log170329.003227.HAL

java - 错误 : java heap space on Google Data-Proc Cluster

我在Googledataproc集群上从一个表运行Hive插入覆盖查询13783531记录到另一个分区表,不做任何转换。失败并出现错误DiagnosticMessagesforthisTask:Error:JavaheapspaceFAILED:ExecutionError,returncode2fromorg.apache.hadoop.hive.ql.exec.mr.MapRedTaskMapReduceJobsLaunched:Stage-Stage-1:Map:34CumulativeCPU:1416.18secHDFSRead:6633737937HDFSWrite:0FAI