草庐IT

java - HBase - 无法抑制 fs 关闭 Hook

我试图通过运行HMaster类在IDEA中启动HBase,但出现此错误:java.lang.RuntimeException:Failedsuppressionoffsshutdownhook:Thread[Thread-8,5,main]atorg.apache.hadoop.hbase.regionserver.ShutdownHook.suppressHdfsShutdownHook(ShutdownHook.java:196)atorg.apache.hadoop.hbase.regionserver.ShutdownHook.install(ShutdownHook.java

EC2 上的 Hadoop 与 ElasticMapReduce/S3

我使用ElasticMapReduce有一段时间了。这很方便,但我无法运行HBase,因为Hadoop集群只是暂时可用(我在HBaseandHadoop上问过一些相关的问题)。所以我想尝试在一组EC2机器上安装Hadoop。我知道Hadoop有一些与EC2相关的目录-src/contrib/ec2。看起来只需键入命令即可启动Hadoop集群,我可以登录到主节点以运行作业等。在尝试这个之前,我想知道任何使用过这个的人的陷阱。谢谢! 最佳答案 事实上,在亚马逊上使用hadoop有两种选择——配置您自己的集群或使用EMR。与此决定正交,您

hadoop - Datanode 重新启动 Hadoop fs -put 以获取大量数据(30 GB)

我有一个包含3个节点的hadoop集群。1个主人和2个奴隶。他们每个人都有24GB的内存。当我执行hadoopfs-put将数据从本地文件系统传输到hdfsdome数据被传输然后我得到一个异常12/11/0619:01:39WARNhdfs.DFSClient:DFSOutputStreamResponseProcessorexceptionforblockblk_-2646313249080465541_1002java.net.SocketTimeoutException:603000millistimeoutwhilewaitingforchanneltobereadyforre

hadoop - 从 AWS 上 EMR 上的 jar 写入 S3 中的文件

有什么方法可以将我的Javajar中的文件写入将写入我的reduce文件的S3文件夹?我试过类似的东西:FileSystemfs=FileSystem.get(conf);FSDataOutputStreamFS=fs.create(newPath("S3folderoutputpath"+"//Result.txt"));PrintWriterwriter=newPrintWriter(FS);writer.write(averageDelay.toString());writer.close();FS.close();这里的Result.txt是我要写入的新文件。

scala - 读取 s3 存储桶时出错

我在尝试使用spark从s3读取文件时遇到异常。错误和代码如下。该文件夹由许多名为part-00000part-00001等的文件组成,这些文件来自hadoop。它们的文件大小范围从0kb到几gb16/04/0715:38:58INFONativeS3FileSystem:Openingkey'titlematching214/1.0/bypublicdemand/part-00000'forreadingatposition'0'16/04/0715:38:58ERRORExecutor:Exceptionintask0.0instage0.0(TID0)org.apache.had

hadoop - Spark - 使用服务器端加密 (AES) 从 s3 读取

在java中创建RDD的一种方法是JavaRDDpeople=sc.textFile("s3://path");如果使用服务器端加密对s3中的数据进行加密会怎样。那么我们如何创建一个RDD? 最佳答案 如果您使用的是启用加密的EMR,那么它应该会在从S3在EMR中处理时自动解密。 关于hadoop-Spark-使用服务器端加密(AES)从s3读取,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/que

hadoop - 与 FS 的连接不良

我正在使用ClouderaHadoop(cdh3u1),但遇到以下错误消息:[root@paulconf.class]#sudo-uhdfshadoopfs-mkdir/user/training12/09/1607:40:26INFOipc.Client:Retryingconnecttoserver:peter/192.168.1.100:8020.Alreadytried0time(s).12/09/1607:40:27INFOipc.Client:Retryingconnecttoserver:peter/192.168.1.100:8020.Alreadytried1time

hadoop - 使用 Spark/Hadoop 从 S3 读取时出错

我正在尝试使用Spark从AmazonS3读取数据.但我越来越java.lang.NoClassDefFoundError:org/jets3t/service/S3ServiceException从Hadoop调用内部。我已经尝试下载jets3t并将所有包含的jar添加到我的类路径中,但它没有帮助。以下是正在发生的事情的完整记录:scala>valzz=sc.textFile("s3n://")13/08/3019:50:21INFOstorage.MemoryStore:ensureFreeSpace(45979)calledwithcurMem=46019,maxMem=8579

hadoop - 是否有 s3distcp 的开源版本?

我很想使用s3distcp将数据从S3存储桶复制到S3存储桶,但我需要使用外部专有加密机制来确保数据在静态时被加密(将key留给自己,以便亚马逊无法解密)我很想做一个gitclone并创建我自己的s3distcp(带有外部加密/解密库的钩子(Hook))。我用谷歌搜索并在这里找到了一个潜力https://github.com/libin/s3distcp但它不是Amazon帐户(显然)并且看起来没有记录/更新。 最佳答案 我构建了一个在Node.js中运行的工具,用于将数据从一个桶复制到另一个桶。https://github.com

java - Hadoop/Eclipse - 线程 "main"java.lang.NoClassDefFoundError : org/apache/hadoop/fs/FileSystem 中的异常

我正在尝试运行来自ManningPublishing的ChuckLam的HadoopinAction中的PutMerge程序。它应该很简单,但我在尝试运行它时遇到了很多问题,而且我遇到了这个我无法弄清楚的错误。同时,我正在运行一个基本的wordcount程序,没有任何问题。我现在已经花了大约3天时间。我已经对此进行了所有可能的研究,但我迷路了。你有什么想法吗?程序:importjava.io.IOException;importorg.apache.hadoop.conf.Configuration;importorg.apache.hadoop.fs.FSDataInputStrea