草庐IT

USER_NAME

全部标签

hadoop - 错误 terasort.TeraSort : Input path does not exist: maprfs:/user/user01/–DXmx1024m

在通过修改参数运行terasort应用程序时,我收到以下错误。15/05/2421:41:42ERRORterasort.TeraSort:Inputpathdoesnotexist:maprfs:/user/user01/–DXmx1024m我正在运行用于执行慢跑的命令$hadoopjar/opt/mapr/hadoop/hadoop-0.20.2/hadoop-0.20.2-dev-\examples.jarterasort–DXmx1024m–Dmapred.reduce.tasks=2\-Dio.sort.mb=1/user/user01/6/TERA_IN/user/user

hadoop - 我如何避免 Hive 表的第一个 "NULL"中的 "Field Name"

首先,我使用以下命令在Hive中创建了表“emp”:createtableemp(idINT,nameSTRING,addressSTRING)ROWFORMATDELIMITEDFIELDSTERMINATEDBY'\t';然后通过以下命令将数据加载到这个“emp”表中:LOADDATALOCALINPATH'\home\cloudera\Desktop\emp.txt'覆盖到表emp;当我从“emp”表中选择数据时:它显示了表Null的第一个字段像这样: 最佳答案 您的文件中有一个标题行,第一个值id无法转换为INT,因此被替换

Hadoop 2.9.0 - hadoop namenode -format 和 hdfs-site.xml dfs.namenode.name.dir

我的第一个问题,我会尽量不把事情搞砸:)出于学习目的,我正在4节点集群上安装Hadoop2.9.0。我已经按照官方ApacheHadoop2.9.0文档和一些谷歌页面开始安装/配置名称节点。我像这样编辑了位于$HADOOP_HOME/etc/hadoop目录下的hdfs-site.xml:dfs.namenode.name.dirfile:///apps/hdfs/namenode/datadfs.datanode.data.dirfile:///apps/hdfs/datanode/datadfs.namenode.checkpoint.dirfile:///apps/hdfs/na

hadoop - Cloudera 虚拟机 - 增加磁盘大小

我已经在Windows上通过VMPlayer使用Cloudera发行版CDH5.4.0设置了一个虚拟机。当我开始使用虚拟机时,它的大小约为7GB。现在它的大小已增加到大约73GB。我这里说的大小是windows上占用的磁盘大小。它会创建很多vmdk文件,如下所示:-rw-r--r--1user_nameAdminist1554776064Dec1510:37cloudera-quickstart-vm-5.4.0-0-vmware-s001.vmdk-rw-r--r--1user_nameAdminist2003632128Dec1510:37cloudera-quickstart-v

scala - Hadoop 端口 : fs. default.name

我有点懵。我看到的几乎所有Hadoop安装“如何”指定的core-site.xml都将fs.default.name设置为9000fs.default.namehdfs://192.168.0.141:9000但是,下面的代码valconf=neworg.apache.hadoop.conf.Configuration()valfs=org.apache.hadoop.fs.FileSystem.get(newjava.net.URI("hdfs://192.168.0.141/"),conf)给我一​​个java.net.ConnectException:指定无法连接到端口8020。

Hadoop 网络用户 : No such user

在运行hadoop多节点集群时,我的主日志中出现以下错误消息,有人可以建议该怎么做吗..?我需要创建一个新用户还是可以在这里提供我现有的Machine用户名2013-07-2519:41:11,765WARNorg.apache.hadoop.security.UserGroupInformation:Nogroupsavailableforuserwebuser2013-07-2519:41:11,778WARNorg.apache.hadoop.security.ShellBasedUnixGroupsMapping:gotexceptiontryingtogetgroupsfor

hadoop - Hive 没有完全遵守 core-site.xml 中的 fs.default.name/fs.defaultFS 值

我在一台名为hadoop的机器上安装了NameNode服务。core-site.xml文件的fs.defaultFS(等同于fs.default.name)设置如下:fs.defaultFShdfs://hadoop:8020我有一个名为test_table的非常简单的表,它当前存在于HDFS上的Hive服务器中。即存放在/user/hive/warehouse/test_table下。它是在Hive中使用一个非常简单的命令创建的:CREATETABLEnew_table(record_idINT);如果我尝试将数据加载到本地表中(即使用LOADDATALOCAL),一切都会按预期进行

amazon-ec2 - 使用 s3 作为 fs.default.name 或 HDFS?

我正在EC2上设置Hadoop集群,我想知道如何进行DFS。我所有的数据目前都在s3中,所有map/reduce应用程序都使用s3文件路径来访问数据。现在我一直在研究Amazon的EMR是如何设置的,它似乎为每个作业流设置了一个名称节点和数据节点。现在我想知道我是否真的需要那样做,或者我是否可以只使用s3(n)作为DFS?如果这样做,有什么缺点吗?谢谢! 最佳答案 为了使用S3而不是HDFS,core-site.xml中的fs.name.default需要指向您的存储桶:fs.default.names3n://your-bucke

DataStage登录报错:Failed to authenticate the current user against the selected Services Tier.

背景:近期同事一直在使用DataStage登录查找作业,突然今天无法登陆了。报错:FailedtoauthenticatethecurrentuseragainsttheselectedServicesTier.结论:解决了。报错处理过程1.开始第一反应是重装DataStage,毕竟我和另外几个同事的能够正常连接,他那边测试DS节点主机名都可以ping通,但是问题来了,发现2个问题:1)安装地址默认跳转到IE11,也就是MicrosoftEdge浏览器。2)MicrosoftEdge浏览器无法完成对DataStage的安装或者卸载动作。2.要处理第一个问题,先要在MicrosoftEdge浏览

java - 组织.apache.thrift : Invalid method name: 'authenticate'

我正在运行出现此错误的用户手册中的一些基本Accumulo代码。简单的谷歌搜索没有提供任何有用的信息。错误org.apache.accumulo.core.client.AccumuloException:org.apache.thrift.TApplicationException:Invalidmethodname:'authenticate'atorg.apache.accumulo.core.client.impl.ServerClient.execute(ServerClient.java:77)atorg.apache.accumulo.core.client.impl.C