hdfs_clusters

hadoop - 增加hdfs java堆内存的正确方法

我的hadoop名称节点日志中出现以下错误:2015-12-2006:15:40,717WARN[IPCServerhandler21on9000]ipc.Server(Server.java:run(2029))-IPCServerhandler21on9000,callorg.apache.hadoop.hdfs.server.protocol.DatanodeProtocol.blockReportfrom172.31.21.110:46999Call#163559Retry#0:error:java.lang.OutOfMemoryError:Javaheapspacejava

hadoop - HDFS在哪里存储它的文件

这可能是非常非常基础的。相对于实际文件系统，单节点HDFS将文件存储在哪里？我正在使用ClouderaVM来学习Hadoop。例如:可以使用/home/cloudera中名为sample.txt的文件复制到HDFShadoopfs-copyFromLocal/home/cloudera/sample.txthdfs://localhost/user/cloudera/sample.txt如果我用linux搜索/user/cloudera目录，实际上是没有这个目录的。现在假设我更改了/home/cloudera/sample.txt的内容，这些更改没有反射(reflect)在存储在HDF

hadoop HDFS section cloudera

hadoop - Mapreduce 日志 - 文件与 HDFS

我提交了一个mapreduce，这是我的输出。下面给出的FILE和HDFS有什么区别？16/01/0721:49:58INFOmapreduce.Job:Counters:38FileSystemCountersFILE:Numberofbytesread=4011012FILE:Numberofbyteswritten=8400605FILE:Numberofreadoperations=0FILE:Numberoflargereadoperations=0FILE:Numberofwriteoperations=0HDFS:Numberofbytesread=11928267HDF

Mapreduce hadoop Number section operations

hadoop - 归档传入的小型 hdfs 文件

我每天都有小文件进入hdfs。我打算使用hadoop归档(HAR)，但我如何归档这些每天进入hdfs的小文件。例如:我今天可能会收到5个文件，我需要将它们存档，明天如果我再收到5个文件，我需要将其附加到前几天的存档中。最佳答案您不能将文件添加到现有的HAR文件中。您需要取消存档并重新存档或合并文件几天，然后创建存档文件。关于hadoop-归档传入的小型hdfs文件，我们在StackOverflow上找到一个类似的问题： https://stackover

传入归档 section 存档 hadoop hdfs archive hadoop-archive bigdata

hadoop - 如果你把东西存到HBase里，能直接从HDFS访问吗？

有人告诉我HBase是一个位于HDFS之上的数据库。但是假设您在将一些信息放入HBase之后使用了hadoop。您仍然可以使用mapreduce访问信息吗？最佳答案您可以使用mapreduce程序或hive查询或pig脚本读取HBase表的数据。Here是mapreduce的例子Here是Hive的示例。创建Hive表后，您可以在HBase表上运行select查询，这将使用mapreduce处理数据。您甚至可以轻松地将HBase表与其他Hadoop生态系统工具(例如Pig)集成。关

hadoop HBase section reduce

hadoop - 查看 HDFS 中文件的内容

我正在运行这个命令:hadoopfs-ls/tej/这是输出:-rw-r--r--1hdusersupergroup192016-02-1918:46/tej/t1.txt你能告诉我如何显示t1.txt中的内容吗？我尝试了cat命令，但无法显示文件中的内容。最佳答案您有几个选择...查看尾部:hadoopfs-tail/tej/t1.txt查看头部:hadoopfs-cat/tej/t1.txt|head查看整个文件:hadoopfs-cat/tej/t1.txt 关于hadoop-

hadoop HDFS code section pre

hadoop - 如何将XML类型的oracle数据迁移到Hadoop HDFS

我在Oracle中有大量数据在一张表中，一列类型是包含主要数据的XML类型。我需要将这些数据移动到HDFS。在HadoopHDFC中迁移这些数据的最佳方式应该是什么。任何示例代码或说明将不胜感激。最佳答案您想将数据作为平面(或csv)文件移动到HDFS还是将表导入到HIVE数据库之一。如果是HIVE导入，您可以使用Sqoop。Sqoop用于将数据从RDBMS数据库导入到HIVEDB。关于hadoop-如何将XML类型的oracle数据迁移到HadoopHDFS，我们在StackOv

hadoop section 明将 stackoverflow hdfs xmltype

hadoop - 在生产系统中将solr数据存储在hdfs中好吗？

我在hadoop集群中使用solr4.x。爬取的数据存储在hadoop中并在solr中建立索引。当前solr配置为使用本地文件系统。我得去生产了。使用本地文件系统好还是solr应该使用hdfs？使用hdfs有什么好处(如果我们必须使用)？将来我的索引大小可能会增加。最佳答案唯一的好处是复制和水平可扩展性。关于hadoop-在生产系统中将solr数据存储在hdfs中好吗？，我们在StackOverflow上找到一个类似的问题： https://stacko

在生 hadoop section solr

hadoop - HDFS 加密 |远程异常

我正在使用以下命令在HDFS中创建加密区域。hdfscrypto-createZone-keyNametes3-path/user/root/zoneEncr但是发射命令，我得到的只是RemoteException:在屏幕上。我检查了日志并得到了以下异常2016-05-0611:05:07,073DEBUGPoolingClientConnectionManager-Connectionreleased:[id:62][route:{}->http://localhost:6083][totalkeptalive:0;routeallocated:0of5;totalallocated

hadoop HDFS apache java AuditFileSpool encryption

hadoop - HDFS 我可以为每个文件指定复制因子以提高可用性吗

我是HDFS的新手，如果我的问题太天真了，我很抱歉。假设我们将文件存储在Hadoop集群中。有些文件非常受欢迎，并且会比其他文件更频繁地被请求(但不会经常将它们放入内存)。保留该文件的更多副本(副本)是值得的。我可以在HDFS中实现它吗？或者是否有解决此任务的最佳实践？最佳答案是的，您可以单独对整个集群/目录/文件执行此操作。您可以使用HadoopFSshell在每个文件的基础上更改复制因子(假设为3)。[sys@localhost~]$hadoopfs–setrep–w3/my/file或者，您可以更改目录下所有文件的复制因子

hadoop HDFS section strong code

131 132 133134135 136 137