草庐IT

File类和IO流

全部标签

java - HBase、Hadoop : How can I estimate the size of a HBase table or Hadoop File System Paths?

我有多个HBase表,如何估计在java中使用的表的大概大小? 最佳答案 一种方法是您必须通常在/hbase文件夹下使用java客户端访问hdfs所有表格信息。将出席。Hadoop外壳:您可以检查使用hadoopfs-du-h**pathtohbase**/hbase在/hbase下每张表多占一个文件夹...hadoopfs-ls-R**hbase路径**/hbasehadoopfs-du-h**hbase路径**/hbase/表名JavaHDFS客户端:同样的,你可以通过在hbaseroot目录下传递每个表路径来使用javahdf

file - 如何检查 HDFS 文件是否包含二进制数据?

是否有任何工具或实用程序可以检查HDFS文件是textfile还是二进制文件,如avro、ORC等?我无法回复文件扩展名。我不想知道确切的类型。我只需要知道数据是否可读。 最佳答案 让我们bash它hdfsdfs-cat/file/on/hdfs|head-15>tmp;file-itmp;rmtmp对于像parquet等不可读的文件,你会得到这个:tmp:application/octet-stream;charset=binary 关于file-如何检查HDFS文件是否包含二进制数据

java - NoSuchMethodError : org. apache.hadoop.io.retry.RetryUtils.getDefaultRetryPolicy

以前我在单节点集群上通过java在hdfs中创建目录,它运行得很顺利,但是一旦我创建了多节点集群,我就得到了这个错误我得到的堆栈跟踪看起来像这样Exceptioninthread"main"java.lang.NoSuchMethodError:org.apache.hadoop.io.retry.RetryUtils.getDefaultRetryPolicy(Lorg/apache/hadoop/conf/Configuration;Ljava/lang/String;ZLjava/lang/String;Ljava/lang/String;Ljava/lang/Class;)Lo

hadoop - 如何修复 "File could only be replicated to 0 nodes instead of minReplication (=1)."?

Iaskedasimilarquestionawhileago,并认为我解决了这个问题,但事实证明它消失了只是因为我正在处理一个较小的数据集。很多人问过这个问题,我已经遍历了所有我能找到的互联网帖子,但仍然没有取得任何进展。我想做的是:我在配置单元中有一个外部表browserdata,它引用了大约1GB的数据。我尝试将该数据粘贴到分区表partbrowserdata中,其定义如下:CREATEEXTERNALTABLEIFNOTEXISTSpartbrowserdata(BidIDstring,Timestamp_string,iPinYouIDstring,UserAgentstri

java - spring-xd如何使用source :file read line one by one

我有一个流,用于监视目录中多个文件的输出、处理数据并将其放入HDFS。这是我的流创建命令:streamcreate--namefileHdfs--definition"file--dir=/var/log/supervisor/--pattern=tracker.out-*.log--outputType=text/plain|logHdfsTransformer|hdfs--fsUri=hdfs://192.168.1.115:8020--directory=/data/log/appsync--fileName=log--partitionPath=path(dateFormat(

java - Accumulo MapReduce 作业因 java.io.EOFException 而失败,使用 AccumuloRowInputFormat

我所有的映射器都失败了,除了下面的异常(exception)。为了简洁起见,我只展示了最后一次失败。为什么会发生这种情况,我该如何解决?16/09/2117:01:57INFOmapred.JobClient:TaskId:attempt_201609151451_0044_m_000002_2,Status:FAILEDjava.io.EOFExceptionatjava.io.DataInputStream.readFully(DataInputStream.java:197)atjava.io.DataInputStream.readUTF(DataInputStream.jav

【已解决】Error response from daemon: Get https://index.docker.io/v1/search?q=zookeeper&n=25: dial tcp: l

已解决:Errorresponsefromdaemon:Gethttps://index.docker.io/v1/search?q=zookeeper&n=25:dialtcp:lookupindex.docker.ioon192.168.xxx.x:xx:readudp192.168.xx.xx:xxxxx->192.168.xx.xx:xxxx:i/otimeoutdocker安装技术栈报错问题原因一:镜像源时国外的,下载被限制问题原因二:网络原因连接不通)docker安装技术栈报错在从Docker上pull镜像的时候遇到了如下问题:Gethttps://registry-1.docke

hadoop - 尝试在 HBase 上独立运行示例时出现 java.io.EOFException

我正在尝试运行这个例子:https://github.com/larsgeorge/hbase-book/blob/master/ch03/src/main/java/client/PutExample.java,来自本书:http://ofps.oreilly.com/titles/9781449396107/,在独立的HBase安装上。启动HBase工作正常并且可以访问shell,但是当我尝试运行示例时出现以下错误:Exceptioninthread"main"java.io.IOException:Callto/127.0.0.1:55958failedonlocalexcept

java - EOFException 在 org.apache.hadoop.io.SequenceFile$Reader.init(SequenceFile.java :1508)

我试图运行Norstadt先生在以下链接下提供的矩阵乘法示例http://www.norstad.org/matrix-multiply/index.html.我可以使用hadoop0.20.2成功运行它,但我尝试使用hadoop1.0.3运行它,但出现以下错误。是我的hadoop配置问题还是作者用hadoop0.20编写的代码中的兼容性问题。另外请指导我如何解决这两种情况下的错误。这是我遇到的错误。inthread"main"java.io.EOFExceptionatjava.io.DataInputStream.readFully(DataInputStream.java:180

java - 错误 : java. io.IOException : wrong value class: class org. apache.hadoop.io.Text 不是类 Myclass

我的映射器和缩减器如下。但是我遇到了一些奇怪的异常。我不明白为什么会抛出这种异常。publicstaticclassMyMapperimplementsMapper{@Overridepublicvoidmap(LongWritablekey,Textvalue,OutputCollectoroutput,Reporterreporter)throwsIOException{Texttext=newText("someText")//processoutput.collect(text,infoObjeject);}}publicstaticclassMyReducerimplemen