non-open

azure - HDInsight 和 Talend Open Studio for Big Data

我目前正在开展一个项目，我需要将TalendopenStudioforBigData(v6.3.1)连接到Azure的HDInsight(3.5)Hadoop集群。到目前为止，我正在尝试一个简单的例子，它包括创建一个Hive表。为此，我使用了下图:配置单元连接配置如下:...请在下面找到tHiveCreateTable_1节点的规范:通过运行这个过程:·创建了指定的容器和部署Blob(见下图)——这让我相信Windows存储配置一切正常·但是tHiveCreateTable_1节点有错误(见下图)·我坚信它与主机名和端口有关；·我尝试使用集群的主机名和我们可以在Ambari中找到的Hi

hadoop - CDH5 Hue Hive — 蜂蜡服务器 : Error opening session: Failed to validate proxy privilage of hue for admin

我通过Kerberos设置了一个具有安全性的Hadoop集群，Hive已经启用了Sentry。我对Hue-Hive(Beeswax)Editor有疑问。Hue无法在hive-server2日志中加载来自hive的数据和信息:2014-04-0311:36:39,814WARNthrift.ThriftCLIService(ThriftCLIService.java:GetSchemas(364))-Errorgettingcatalogs:org.apache.hive.service.cli.HiveSQLException:InvalidSessionHandle:SessionH

privilage validate java ThriftCLIService apache hadoop hive hue apache-sentry

hadoop - YARN-Cgroups : Failed to initialize container executor in non-secure cluster

我正在尝试在非安全模式下将cgroups与YARN2.6.0结合使用。有用如果我使用DefaultContainerExecutor就好了。但是，当我尝试使用LinuxContainerExecutor时出现错误。现在，当我执行-->$yarnnodemanager时，它失败了ExitCodeExceptionexitCode=24:File/home/hduser2/hadoop/hadoop-2.6.0/etc/hadoopmustbeownedbyroot,butisownedby1001atorg.apache.hadoop.util.Shell.runCommand(Shel

YARN-Cgroups initialize hadoop NodeManager mapreduce hadoop-yarn cgroups

hadoop - PIG : Unable to open iterator for alias AliasName. 标量在输出中有多于一行

我是pig的新手，正在尝试自学。我编写了一个脚本来获取从words.txt文件中读取的单词的纪元时间。这是脚本。words=LOAD'words.txt'ASword:chararray;B=FOREACHAGENERATECONCAT(CONCAT(A.word,'_'),(chararray)ToUnixTime(CurrentTime());dumpB;但问题是，如果words.txt文件只有一个单词，它会给出正确的输出。如果它有多个词，比如word1word2word3word4然后它给出了以下错误ERROR1066:UnabletoopeniteratorforaliasBj

多于 AliasName word section strong hadoop apache-pig epoch

sockets - Hadoop Impala 1.3.1 和 Open Socket 错误

我们刚刚将Impala从1.2.4升级到1.3.1，将CDH从4.6升级到4.7，然后开始出现写入问题(读取正常):尝试创建表时——出现套接字错误:createtabletest_5(xint,ystring);Query:createtabletest_5(xint,ystring)ApplicationException:Calledwriteonnon-opensocket尝试刷新表格时会发生同样的情况:invalidatemetadata;Query:invalidatemetadataApplicationException:Calledwriteonnon-opensock

sockets Hadoop section code blockquote impala

security - 如何将cloudera apache sentry与open ldap集成

我的CDH5.10快速启动VM中有LDAP用于开发，我已经在其中启动了Sentry服务。现在我想将ApacheSentry与LDAP集成。请让我知道这是否可行，如果可行，请指导我完成解决方案。最佳答案是的，可以将Sentry与LDAP集成。说明可以在这里找到:ConfiguringLDAPGroupMappingsUsingLDAPUsername/PasswordAuthenticationwithHiveServer2EnablingSentryAuthorizationforImpalaConfiguringtheSent

security cloudera noreferrer https hadoop cloudera-quickstart-vm apache-sentry

Hadoop:为什么我在 Namenode Information Web 中收到 "Max Non Heap Memory is -1 B."消息？这是什么意思？

我有一个使用VirtualBox制作的Hadoop2.6.5集群(一个主节点用作名称节点和数据节点，两个从节点)(easch节点安装了Xubuntu16.04)。先验，安装是正确的，因为我运行了一个wordcount示例并且没问题。在master:50070(我看到名称节点信息的地方)，我得到这个:"MaxNonHeapMemoryis-1B."你知道这是什么意思吗？我找不到答案，我想检查一下，因为在运行wordcount之后我尝试运行我自己的程序但它没有成功，尽管它在我的Hadoop单节点安装中运行正常。我希望清楚，如果您需要更多信息，请告诉我。谢谢! 最

Information amp section Hadoop 中运 virtualbox cluster-computing heap-memory namenode

hadoop - 在 hadoop 中释放 "Non-DFS used"空间

我正在尝试将我们的数据加载到hadoophdfs中。经过一些测试运行，当检查hadoopwebui时，我意识到标题“使用的非DFS”下占用了大量空间。事实上，“Non-DFSused”比“DFSused”要多。因此，几乎一半的集群被非DFS数据消耗。即使在重新格式化namenode并重新启动之后，这个“非DFS”空间也没有被释放。此外，我无法找到存储此“非DFS”数据的目录，因此我无法手动删除这些文件。我在网上阅读了很多陷入完全相同问题的人的帖子，但没有一个得到明确的答案。清空这个“非DFS”空间有那么难吗？还是我不应该删除它？我怎样才能释放这个空间？最佳

hadoop amp DFS section strong hdfs

ubuntu - Accumulo 的 Start-all.sh 抛出多个关于 : Max open files on localhost 的警告

我收到关于以下内容的多个警告:WARN:Maxopenfilesonlocalhostis1024,recommend32768我不确定这是关于什么的。/usr/local/accumulo$./bin/start-all.sh&[1]27142/usr/local/accumulo$StartingmonitoronlocalhostWARN:Maxopenfilesonlocalhostis1024,recommend32768Startingtabletservers....doneStartingtserveronlocalhostWARN:Maxopenfilesonloca

Start-all localhost section recommend ubuntu hadoop networking apache-zookeeper accumulo

hadoop - Non DFS Used 到底是什么意思？

这是最近在WebUI上看到的ConfiguredCapacity:232.5GBDFSUsed:112.44GBNonDFSUsed:119.46GBDFSRemaining:613.88MBDFSUsed%:48.36%DFSRemaining%:0.26%我很困惑，非dfsUsed占用了一半以上的容量，我认为这意味着一半的hadoop存储被浪费了在浪费了无意义的时间搜索之后，我只是格式化了namenode，然后从头开始。然后我从本地复制了一个巨大的文本文件(大约19GB)到HDFS(成功)。现在UI显示ConfiguredCapacity:232.5GBDFSUsed:38.52G

到底 hadoop DFS Used strong hdfs

204 205 206207208 209 210