hdfs_clusters

excel - 来自 Excel Power Query 的 HDFS 连接

拥有一台运行Hadoop实例的服务器。基本上，我想通过本地计算机上的Excel连接到一些HDFS表。我知道PowerQuery插件有助于处理该操作并提供与HDFS建立连接的机会。但事情是这样的——我有Excel2016，所以根据Microsoft文档，PowerQuery已经内置在Excel中。但是当我尝试执行“数据-从其他来源获取数据”时，根本没有“从Hadoop文件(HDFS)获取数据”之类的选项我做错了什么，我需要采取哪些具体步骤才能从Excel访问HDFS？最佳答案对我来说，HDFS显示在这里:但不是这里:第一个“来自其

java - 如何以编程方式写入 HDFS？

因此，经过36小时的试验之后，我终于设法启动并运行了一个集群，但现在我很困惑如何使用Java向其写入文件？一个教程说应该使用这个程序，但我完全不理解它，它也不起作用。publicclassFileWriteToHDFS{publicstaticvoidmain(String[]args)throwsException{//SourcefileinthelocalfilesystemStringlocalSrc=args[0];//DestinationfileinHDFSStringdst=args[1];//Inputstreamforthefileinlocalfilesystem

何以 java code section file hadoop hdfs

java - 失败 : ParseException line 1:94 mismatched input 'hdfs' expecting StringLiteral near 'location' in partition location

Java代码:Stringcmd0="hive-e\"use"+hiveuser+";sethive.exec.compress.output=true;setmapred.output.compression.codec=com.hadoop.compression.lzo.LzopCodec;setmapreduce.job.queuename="+queue+";altertable"+"resident_tmp"+"addifnotexistspartition(weekday='"+"weekday=20170807"+"')location"+location+"\"";C

amp location hive java apache mysql hadoop

Hadoop HDFS 就地压缩

因此，在hdfs上的/var/log/...中有一堆日志文件，可以解压缩或使用snappy压缩。如果它们不以.snappy结尾，我想压缩它们，并用结尾命名它们。但我想用数据局部性来做到这一点，最好是把名字弄对。我尝试了hadoop流方法。HAD=/usr/lib/hadoop$HAD/bin/hadoopjar$HAD/hadoop-streaming.jar\-Dmapred.output.compress=true\-Dmadred.output.compression.codec=org.apache.hadoop.io.compress.SnappyCodec\-Dmapred

就地 Hadoop code section hdfs snappy

hadoop - zeppelin standalone 用于 hdfs 和 spark 的学习目的我需要安装什么？

我不得不说我有点糊涂了，我没有超过apachezeppelindocumentation我有以下问题。我的最终目标是让本地zeppelin与本地hdfs和本地spark一起工作，以进行简单的练习，所需的安装最少。问题齐柏林飞艇安装就足够了吗？是否包括本地hdfs、spark的组件？如果没有，我还需要安装什么才能拥有本地spark和hdfs？我是否需要安装本地hdfs(假设我想使用hdfs)以及是否需要安装本地spark(假设我想使用本地spark)。谢谢最佳答案安装Zeppelin，看是否自带Spark解释器。我想是的，我知道t

standalone zeppelin section strong spark hadoop apache-spark apache-zeppelin

hadoop - SparkR 错误 : The root scratch dir:/tmp/hive on HDFS should be writable

我正在尝试初始化SparkR，但出现权限错误。我的Spark版本是spark-2.2.1-bin-hadoop2.6。我搜索了这个错误以及如何解决它，我发现了几个相关的主题。但是，我无法使用与这些主题相同的方法来解决它，他们提供的解决方案(以及我尝试过的解决方案)是使用以下命令授予/tmp/hive目录权限:sudo-uhdfshadoopfs-chmod-R777/tmp/hive有足够知识的人可以给我另一种可能的解决方案吗？错误堆栈跟踪如下:$sudo./bin/sparkRRversion3.4.2(2017-09-28)--"ShortSummer"Copyright(C)20

writable scratch scala AbstractChannelHandlerContext apache hadoop apache-spark hive hdfs sparkr

hadoop hdfs namenode 格式不起作用

我是hadoop新手，我尝试在我的vm中安装hadoop3.0，在我配置hadoop之后，然后尝试:hdfsnamenode‐format得到输出:2017-12-2600:20:56,255INFOnamenode.NameNode:STARTUP_MSG:/************************************************************STARTUP_MSG:StartingNameNodeSTARTUP_MSG:host=localhost/127.0.0.1STARTUP_MSG:args=[‐format]STARTUP_MSG:ver

namenode hadoop code

java - 一旦主 NN 出现故障，自动从 Java 应用程序连接到 HDFS 辅助 NN

我有一个简单的Java客户端，可以将文件保存到HDFS-配置了1个名称节点。为此，我使用hadoop配置，指定默认文件系统，如:org.apache.hadoop.conf.Configurationconf=neworg.apache.hadoop.conf.Configuration();conf.set("fs.defaultFS","hdfs://NNip:port");但是，将来我需要连接到配置有1个Activity名称节点和1个备用名称节点的hdfs，以防Activity名称节点出现故障，自动使用备用名称节点。有没有人对如何实现这一目标有任何建议？任何链接/示例将不胜感激，

辅助一旦 section code Configuration java hadoop hdfs namenode

hadoop - 将本地 HDFS 文件系统浏览器与 IntelliJ IDEA 集成

我使用我大学的HDFS集群研究了MapReduce范式，通过HUE访问它。在HUE中，我可以浏览文件、阅读/编辑文件等等。所以在那个集群中我需要:我放置MapReduce.jar的普通文件夹访问HDFS中的结果我非常喜欢编写MapReduce应用程序，所以我已经正确配置了一个本地HDFS作为个人Playground，但现在我只能通过非常浪费时间的命令行(例如those)访问它。我可以通过SFTP远程主机连接的方式“直接”访问我完整的IntelliJIDEA的HDFS，下面是“用户普通文件夹”:这是HUE的HDFS，我从中得到了结果:显然在我的本地机器上，“普通用户文件夹”是我使用she

IntelliJ hadoop noreferrer noopener nofollow intellij-idea filesystems remote-access

hadoop - 浏览 HDFS 的权限被拒绝

我正在学习Hadoop和Spark环境，我成功地安装了这两个环境。但是，当我想进入HDFS管理(localhost:50070/explorer)并且我想点击tmp时，我遇到了这个问题:Permissiondenied:user=dr.who,access=READ_EXECUTE,inode="/tmp":valentin:supergroup:drwx-wx-wx我尝试更改权限:hdfsdfs–chmod–R755/valentin但是我得到:–chmod:Unknowncommand这很奇怪，因为我有:valentin@hadoop:~/hadoop-2.9.0$bin/hdfs

hadoop HDFS code HADOOP_HOME permission-denied

124 125 126127128 129 130