sh_name_草庐IT

hadoop - 开始-dfs.sh : command not found on ubuntu 12. 04

我已经安装了hadoop2.2.0。在Ubuntu12.04上。但是命令start-dfs.sh不起作用。当我运行此命令时，它返回start-dfs.sh:commandnotfound。start-dfs.sh、start-all.sh、stop-dfs.sh和stop-all.sh位于sbin目录中。可能是什么问题？最佳答案第一个解决方案设置Hadoop环境变量$cd~$vi.bashrc pastefollowingtotheendofthefile #HadoopvariablesexportJAVA_HOME=/usr

hadoop - 无法在 Hadoop 多节点集群中启动 start-dfs.sh

我已经创建了一个hadoop多节点集群，并且还在主节点和从节点中配置了SSH，现在我可以在主节点中无需密码连接到从节点但是当我尝试在主节点中启动dfs.sh时，我无法连接到从节点，执行在下面的行停止日志:HNname@master:~$start-all.shstartingnamenode,loggingto/usr/local/hadoop/libexec/../logs/hadoop-HNname-namenode-master.outHDnode@slave'spassword:master:startingdatanode,loggingto/usr/local/hadoop

start-dfs hadoop code 点中

hadoop - 全局变量 HADOOP_USER_NAME oozie？

有什么方法可以在oozie工作流中将HADOOP_USER_NAME声明为全局变量？实际上，我正在为我的项目创建多个shell操作，但为每个shell操作声明一个HADOOP_USER_NAME效率不高，这就是为什么我想知道在这种情况下是否可以使用全局变量，如果可以，我该如何继续它。..非常感谢您的帮助。这是我正在使用的代码HADOOP_USER_NAME*****Error[${wf:errorMessage(wf:lastErrorNode())}]${jobTracker}${nameNode}script1.shscript1.sh#script1.sh出于某种原因，我没有从H

HADOOP_USER_NAME hadoop lt gt shell oozie oozie-coordinator sqoop

hadoop - Hive 'alter table <table name> concatenate' 是如何工作的？

我有n(large)个小型orc文件，我想将它们合并到k(small)个大型orc文件中。这是在Hive中使用altertabletable_nameconcatenate命令完成的。我想了解Hive是如何实现的。如果需要，我希望使用Spark进行任何更改来实现这一点。任何指针都会很棒。最佳答案根据AlterTable/PartitionConcatenate:如果表或分区包含很多小的RCFiles或ORC文件，那么上面的命令会将它们合并成更大的文件。在RCFile的情况下，合并发生在block级别，而对于ORC文件，合并发生在

amp table section code noreferrer hadoop hive hiveql orc

hadoop - 为什么在执行 "/shared"时未列出 `hadoop fs -ls` 目录，尽管在执行 `hadoop fs -ls/shared/table_name` 时它是可见的

当我执行-ls命令时，未列出/shared目录[cts573151@aster2~]$hadoopfs-lsdrwx-------cts573151supergroup02016-12-2105:30.Trashdrwxr-xr-x-cts573151supergroup02017-02-0112:28.sparkStagingdrwx-------cts573151supergroup02017-02-0211:37.stagingdrwxr-xr-x-cts573151supergroup02016-12-1911:40_sqoopdrwxr-xr-x-cts573151super

hadoop shared supergroup code drwxr-xr-x hdfs

hadoop - 使用 start-dfs.sh 的问题

我使用此链接创建了一个4节点集群:https://blog.insightdatascience.com/spinning-up-a-free-hadoop-cluster-step-by-step-c406d56bae42，但是一旦我到达启动hadoop集群的部分，我就会收到如下错误:$HADOOP_HOME/sbin/start-dfs.shStartingnamenodeson[namenode_dns]namenode_dns:mkdir:cannotcreatedirectory‘/usr/local/hadoop/logs’:Permissiondeniednamenode

start-dfs hadoop local usr installation

hadoop 3.1.2 ./start-all.sh 错误，意外标记附近的语法错误 `<'

我在mac上运行hadoop3.1.2，当执行./start-all.sh时，出现错误提示Startingnamenodeson[localhost]/usr/local/Cellar/hadoop/3.1.2/libexec/bin/../libexec/hadoop-functions.sh:line398:syntaxerrornearunexpectedtoken`我打开hadoop-functions.sh并在第398行找到以下信息:done知道如何解决这个问题吗？最佳答案您发现了一个错误，但它不太可能很快得到解决。M

amp start-all hadoop libexec hadoop-functions namenode

python - 为什么从PyHive包导入hive后出现 "ImportError: No module named builtins"？

我有一个简单的问题要问。我一直在尝试使用impyla从Python执行HIVE查询包裹。但我坚持cursorproblem，已经在stackoverflow上提出了一个问题。在这个问题中，一位用户回答并建议使用PyHive。相反。因此，现在我正在尝试使用PyHive从Python执行HIVE查询。但不幸的是，我陷入了另一个似乎并不复杂的问题。一旦我在python中执行以下行，我就会收到错误消息:In[18]:frompyhiveimporthiveTraceback(mostrecentcalllast):File"",line1,infrompyhiveimporthiveFile"

ImportError amp section strong stackoverflow python hadoop hive

hadoop - fs.checkpoint.dir 和 dfs.name.dir 有什么区别？

主要是dfs.name.dir属性是用来存储namenode的fsimage到特定位置备份的，fs.checkpoint.dir属性是fsimage合并的位置。这让我有点困惑。任何人都可以详细解释我。最佳答案 dfs.name.dir是namenode在磁盘中存放fsimage和editlogs的地方。这是一个强制性的位置。没有这个位置，hadoop集群将无法启动。这将位于名称节点主机中。fs.checkpoint.dir是本地文件系统上的目录，DFS辅助名称节点应在其中存储要合并的临时图像。如果这是一个以逗号分隔的目录列表，则图

checkpoint dir section namenode fsimage hadoop hdfs

hadoop - Oozie 和 Hive : FAILED: SemanticException Unable to fetch table <table_name>

我今天刚启动Oozie，我注意到在运行Hive操作时出现不一致的错误。当我运行完全相同的Oozie工作流时，有时它会成功，而有时它会因Hive操作的此错误而失败:FAILED:SemanticExceptionUnabletofetchtable1)这是什么原因？2)解决方法是什么？目前我只是再次运行Oozie作业直到成功，有时需要多次尝试。我正在使用ClouderaCDH4、MRv1。我是手动安装的，而不是使用ClouderaManager。我有一个三节点集群。Master节点包含NameNode、SecondaryNameNode、JobTracker、HMaster；此外，Mas

table SemanticException section Oozie hadoop hive cloudera