草庐IT

hdfs-agent

全部标签

hadoop - HDFS 文件夹到键值配置单元表

我在HDFS中有以下文件夹结构:多边形文件1.kml文件2.kmlfile3.kml我想将它加载到具有以下架构的配置单元表中:表“多边形”:name|kmlfile1|contentoffile1file2|contentoffile2file3|contentoffile3如何在Hive中完成此操作? 最佳答案 据我所知,仅使用Hive是不可能的。但是您当然可以使用bash(我想它是一台Linux机器)。首先创建输入文件,例如:#!/bin/bash#thedirpathtobepassedasparameterforfilein

hadoop - 从远程服务器访问 hdfs 时,Kerberos 默认为错误的主体

我已将kerberos配置为从远程服务器访问hdfs,并且我能够进行身份验证并生成票证,但是当我尝试访问hdfs我收到一个错误:09/0215:50:02WARNipc.Client:Exceptionencounteredwhileconnectingtotheserver:java.lang.IllegalArgumentException:ServerhasinvalidKerberosprincipal:nn/hdp.stack.com@GLOBAL.STACK.COM在我们的krb5.conf文件中,我们在不同的域下定义了admin_server和kdc:DEV.STACK.

java - 如何忽略前两个字节 hdfs writeUTF 和 writeChars?

我已经在hdfs中写入了一些数据,但我希望其中没有writeUTF()方法写入的前两个字节。我想将这个前两个字节的免费hdfs文件复制到本地文件并对其进行一些分析。if(fs.exists(filenamePath)){//removethefilefirst//fs.delete(filenamePath);out=fs.append(filenamePath);}//createiffiledoesntexistselse{out=fs.create(filenamePath);}out.writeUTF(getFeaturesString(searchCriteriaList,f

hadoop - HDFS 到 Cassandra

是否可以将已处理的文件(使用PIG)从本地HDFS(比方说192.168.0.10)迁移/复制/复制/移动到cassandra(192.168.0.20)?我的想法是,我实际上创建了一个java应用程序来解析文件并将它们重新插入到cassandra中。还有其他方法吗?非常感谢! 最佳答案 写一个Java程序将Hadoop数据迁移到Cassandra表,其实是大材小用。如果您碰巧定期执行相同的操作,情况会变得更糟。相反,我们可以利用Hive的一个非常有用的功能,它可以帮助我们将Hive表与外部数据源集成。其hive的StorageHa

hadoop - Hadoop copyFromLocal 是否创建 2 个副本? - 1 个在 hdfs 内部,其他在 datanode 内部?

我在安装在windows10上的vmware中的Ubuntu上安装了伪分布式独立hadoop版本。我从网上下载了一个文件,复制到ubuntu本地目录/lab/data我在ubuntu中创建了名为namenodep和datan1的namenode和datanode文件夹(不是hadoop文件夹)。我还在hdfs中创建了一个文件夹作为/input。当我将文件从ubuntu本地复制到hdfs时,为什么该文件存在于以下两个目录中?$hadoopfs-copyFromLocal/lab/data/Civil_List_2014.csv/input$hadoopfs-ls/input/input/

hadoop - 在 HDFS-Solr 中存储索引文件

我正在配置Solr以将索引数据文件存储在HDFS中。bin/solrstart-ecloud-c-Dsolr.directoryFactory=HdfsDirectoryFactory-Dsolr.lock.type=hdfs-Dsolr.hdfs.home=hdfs://localhost:50070/solr当我尝试打开solr的url时出现“SolrCore初始化失败”错误,创建目录时出现问题。 最佳答案 使用的端口好像不对hdfs://localhost:50070/solr试试hdfs://localhost:8020/s

linux - 从 Windows 服务器读取/写入文件到 HDFS

我想从Windows服务器将文件写入HDFS。Hadoop集群在Linux上。我尝试在所有地方进行研究,我得到了可以使用“hadoopjar”运行的java代码有人可以帮助我了解如何运行HDFS文件并从Windows编写Java代码吗?Windows框需要什么?即使是正确的链接也可以。 最佳答案 您只需编写一个简单的java程序并像普通.jar文件一样运行它。项目中需要导入hadoop库这是一个工作示例Maven项目(我在我的集​​群上测试过它):importorg.apache.hadoop.conf.Configuration;

hadoop - Hive 无法从 hdfs 读取十进制值

我的配置单元版本是0.13。我有一个包含十进制值和一些其他数据类型的文件。该文件是在执行一些Pig转换后获得的。我在此HDFS文件之上创建了一个Hive表。当我尝试执行select*fromtable_name时,我发现文件中的十进制值被截断为整数值。这可能是什么原因?下面是我的表格:CREATETABLEFSTUDENT(load_dtestringCOMMENT'DATE/TIMEOFFILECREATION',xyzDECIMAL,student_idint)ROWFORMATDELIMITEDFIELDSTERMINATEDBY'\u0001'LINESTERMINATEDBY

hadoop - 增加hdfs java堆内存的正确方法

我的hadoop名称节点日志中出现以下错误:2015-12-2006:15:40,717WARN[IPCServerhandler21on9000]ipc.Server(Server.java:run(2029))-IPCServerhandler21on9000,callorg.apache.hadoop.hdfs.server.protocol.DatanodeProtocol.blockReportfrom172.31.21.110:46999Call#163559Retry#0:error:java.lang.OutOfMemoryError:Javaheapspacejava

hadoop - HDFS在哪里存储它的文件

这可能是非常非常基础的。相对于实际文件系统,单节点HDFS将文件存储在哪里?我正在使用ClouderaVM来学习Hadoop。例如:可以使用/home/cloudera中名为sample.txt的文件复制到HDFShadoopfs-copyFromLocal/home/cloudera/sample.txthdfs://localhost/user/cloudera/sample.txt如果我用linux搜索/user/cloudera目录,实际上是没有这个目录的。现在假设我更改了/home/cloudera/sample.txt的内容,这些更改没有反射(reflect)在存储在HDF