hdfs_clusters

Hadoop Kerberos : hdfs command 'Failed to find any Kerberos tgt' even though I had got one ticket using kinit

我为Hadoop集群设置了Kerberos身份验证。当我尝试使用kinit获取kerberos票证时，它将票证存储在krb5cc_0中$sudoklistTicketcache:FILE:/tmp/krb5cc_0Defaultprincipal:hduser/stwhdrm01@FDATA.COMValidstartingExpiresServiceprincipal01/04/201810:15:1401/05/201810:15:14krbtgt/FDATA.COM@FDATA.COM但是当我尝试在命令行上列出HDFS目录时，出现以下错误:$hdfsdfs-ls/openjdkv

apache-spark - 使用 Hive 时了解 HDFS 中的文件分布和分区

一方面，在HDFS文档中他们说:HDFSisdesignedtosupportverylargefiles.ApplicationsthatarecompatiblewithHDFSarethosethatdealwithlargedatasets.Theseapplicationswritetheirdataonlyoncebuttheyreaditoneormoretimesandrequirethesereadstobesatisfiedatstreamingspeeds.HDFSsupportswrite-once-read-manysemanticsonfiles.Atypi

apache-spark apache code HDFS section hadoop hive bigdata

hadoop - 用于 Teradata 的 HDFS

根据我的理解，HDFS对于非结构化和大量的数据很有用。我想知道，是否可以将HDFS与Teradata一起使用，因为Teradata是RDBMS，因此不是那么非结构化？此外，HDFS是如何与数据库结合在一起的。是文件系统包含数据还是简单来说它是如何工作的？谢谢最佳答案使用TeradataDB本身-不。然而:)，Teradata提供所谓的UDA(统一数据架构)，其中Teradata、AsterDB和Hadoop(HDFS)相互连接并可以协同工作几乎无缝:)。一般来说，如果您只想处理非结构化数据，请选择Aster。这是Teradata

Teradata hadoop strong section hdfs

java - hadoop - HDFS 文件分发

我刚开始玩Hadoop，我有以下疑问:我们很清楚Namenode有关于输入block的“元数据”信息。现在我的问题是:如何查看或查询元数据？我如何查看-我的输入文件是如何被阻止和分发的？如何确保我的输入文件在HDFS中被阻止和分发？PS:我已经提到了以下网站:http://bradhedlund.com/2011/09/10/understanding-hadoop-clusters-and-the-network/谢谢! 最佳答案如何查看或查询元数据？您可以借助OfflineImageViewer来做到这一点。它是一种将fsim

分发 hadoop strong section java hdfs

hadoop - 在本地运行 Hadoop，在 VM 中访问 HDFS。找不到本地文件

为什么HDFS不能从我的本地机器读取文件？此异常中的路径似乎表明它正在从我的笔记本电脑(而不是VM)读取，但找不到该文件。ls显示它确实存在(见底线)。请让我知道我可以提供更多信息!java.io.FileNotFoundException:Filefile:/Users/rose/bigdata/4/data/data.txtdoesnotexistatorg.apache.hadoop.fs.RawLocalFileSystem.getFileStatus(RawLocalFileSystem.java:468)atorg.apache.hadoop.fs.FilterFileSy

hadoop apache code hdfs

scala - 在 Spark 中加入两个 HDFS 文件

我想使用sparkshell连接来自HDFS的两个文件。这两个文件都是制表符分隔的，我想加入第二列尝试过的代码但不给出任何输出valny_daily=sc.parallelize(List("hdfs://localhost:8020/user/user/NYstock/NYSE_daily"))valny_daily_split=ny_daily.map(line=>line.split('\t'))valenKeyValuePair=ny_daily_split.map(line=>(line(0).substring(0,5),line(3).toInt))valny_divid

中加 scala line enKeyValuePair code hadoop apache-spark

hadoop - reducer 的输出发送到 HDFS，其中 map 输出存储在数据节点本地磁盘中？

我对HDFS存储和数据节点存储有点困惑。以下是我的疑惑。Map函数输出将保存到数据节点本地磁盘，reducer输出将发送到HDFS。众所周知，数据block存储在数据节点本地磁盘中有没有数据节点中可用于HDFS的其他磁盘空间？？reducer输出文件(part-nnnnn-r-00001)的物理存储位置是什么？它会存储在名称节点硬盘中吗？所以我假设数据节点是HDFS的一部分，我假设数据节点本地磁盘也是HDFS的一部分。问候苏雷什最佳答案您必须知道虚拟概念和实际存储之间的区别。HDFS(Hadoop分布式文件系统)只是指定数据将如

地磁送到 strong section HDFS hadoop hadoop-streaming hadoop-partitioning hadoop2

Hue 中的 hadoop.hdfs_clusters.default.webhdfs_url 错误

任何人都可以帮我解决这个色调错误。Currentvalue:http://localhost:50070/webhdfs/v1Failedtocreatetemporaryfile"/tmp/hue_config_validation.15785472045199379485"仅供引用，我使用的是ClouderaManager5.1.3和Hue3.6。最佳答案好的，我自己解决问题。错误原因是NameNode处于安全模式。此命令将使您的Namenode离开安全模式。sudo-uhdfshdfsdfsadmin-safemodele

hdfs_clusters webhdfs_url section hadoop hdfs hue

java - 5 个 150 MB 的文件在 hdfs 中有多少 block

假设有5个文件，每个文件大小为150MB。现在，当我将这些文件放入hdfs(block大小为64mb)时，每个文件和总block数将是多少block。还有所有文件的拆分次数。以及有多少映射器最佳答案每个文件将有3个block(64mb、64mb、32mb)。所以总block数5*3=15因此拆分数将为15。因此映射器数(如果使用FileInputFormat)=15。解释:HDFSdonottakeanentireblocktostoreafilewithsize·Clientwillwritedateintoit·Afterw

block java section size hadoop mapreduce

hadoop - HDFS 可以复制到其他集群吗？

HDFS正在复制到同一个集群中的事实3。这很好，但是有没有办法设置HDFS以便它也可以复制到不同的集群/服务器？假设1个复制到同一个集群，另一个复制到另一个HDFS集群中的某个地方。如果HDFS不支持此功能，是否有任何围绕Hadoop的工具允许我们这样做？你们如何在其他服务器上进行复制？最佳答案目前没有任何机制可以满足您的要求。HBase实现了跨集群复制，HDFS还没有实现。有一个plantosupportHDFS中的跨数据中心复制，但尚未实现。您可以使用distcp定期将数据复制到另一个集群的机制。这将在每个集群上放置3个副本

hadoop HDFS section replication

186 187 188189190 191 192