草庐IT

iftop命令

全部标签

r - 通过命令行提交后编辑 Oozie Workflow

在使用命令行运行oozie工作流后,我无法使用HueWorkflow编辑器对其进行编辑,甚至无法在工作流列表中找到它。我有一个生成workflow.xml和job.properties的R脚本,并将运行运行脚本所需的命令:workflow.path将工作流移动到HDFS中工作正常,我已经验证它是使用oozie的有效工作流。运行作业也很有效,但是如果我打开Hue,导航到工作流并找到它,我无法编辑它,只能重新运行它。关于我正在尝试做的事情的一些背景:我们有大量的自动化工作流程,而且我们一直在添加更多。它们都遵循相同的模式,因此自动创建协调器和工作流很简单。有时,这些工作流程必须由人修改,并

hadoop - 抑制命令行输出 hadoop fs 命令

我正在使用Python程序运行hadoopmapreduce作业,该程序创建不同的输入路径作为mapreduce作业的参数。在将这些输入路径传递到mapreduce之前,我目前正在使用以下命令检查hadoopfs路径是否存在:hadoopfs-test-e'filename'然后我的Python程序与命令行通信并确定文件是否存在(当文件存在时-test返回0,否则返回一个大于1的整数)。由于Python程序正在检查路径是否存在并将所有不存在的路径输出到单独的.txt文档,因此我不需要知道哪些路径不存在作为命令行警告。我想知道如何抑制(或忽略)自动hadoopfs输出:test:'fil

linux - 运行此命令时出现错误 mahout trainnb -i path_to/train-vectors -el -li path_to/labelindex -o path_to/model -ow -c

见附图。我在本地使用mahout。我已将序列文件转换为稀疏向量,并将该集合分成两组:训练集和测试集:mahoutsplit-itweets-vectors/tfidf-vectors--trainingOutputtrain-vectors--testOutputtest-vectors--randomSelectionPct40--overwrite--sequenceFiles-xmsequential.运行此命令时出现错误mahouttrainnb-itrain-vectors-el-lilabelindex-omodel-ow-c 最佳答案

hadoop - 使用 jar 命令执行 WordCount 程序时 hadoop 中出现 "No such file or directory"

我是Hadoop的新手,正在尝试执行WordCount问题。到目前为止我所做的事情-引用以下链接设置Hadoop单节点集群。http://www.bogotobogo.com/Hadoop/BigData_hadoop_Install_on_ubuntu_single_node_cluster.php引用下面的链接写出字数统计问题https://kishorer.in/2014/10/22/running-a-wordcount-mapreduce-example-in-hadoop-2-4-1-single-node-cluster-in-ubuntu-14-04-64-bit/问题

amazon-web-services - PIG 中的 DUMP 命令不起作用

我编写了一个简单的PIG程序,如下所示,用于分析AWS上的googlen-grams数据集的小型修改版本。数据看起来像这样:Iam193694290Iam19458115Iam19514712verycool192311810verycool1980320100verycool2012994302verycool20171820612并具有以下形式:n-gramTAByearTABoccurrencesTABbooksNEWLINE我编写了以下程序来计算每本书中ngram的出现次数:inp=LOADAS(ngram:chararray,year:int,occurences:int,b

shell - 在 hadoop 集群中运行 bash 脚本的 Hadoop 命令

我有一个shell脚本(count.sh),它计算文件中的行数。此脚本已复制到hdfs中,目前正在使用Oozie工作流来执行此脚本。不过,我想知道是否有办法从命令行执行此shell脚本。例如:在unix中:[myuser@myserver~]$./count.sh当count.sh位于hadoop集群位置'/user/cloudera/myscripts/count.sh'时等效于此。我读了这个Hadoopcommandtorunbashscriptinhadoopcluster,但还是不清楚。 最佳答案 我知道这是一篇旧帖子,但我

java - Hadoop 运行命令 java.lang.ClassNotFoundException

我已经成功安装了hadoop3.0.0独立运行在Ubuntu16.04上。我使用Apachehadoop教程中的以下代码创建了一个jar。importjava.io.IOExceptionimportjava.util.StringTokenizer;importorg.apache.hadoop.conf.Configuration;importorg.apache.hadoop.fs.Path;importorg.apache.hadoop.io.IntWritable;importorg.apache.hadoop.io.Text;importorg.apache.hadoop.

hadoop - 我是 hadoop 的新手,正在学习基础知识。我最近安装了沙箱,但我无法运行 Hadoop 命令

[root@sandbox-hdp~]#hdfsdfs-lsls:`.':Nosuchfileordirectory[root@sandbox-hdp~]#hdfsdfs-mkdirmayankmkdir:`mayank':Nosuchfileordirectory[root@sandbox-hdp~]# 最佳答案 hdfsdfs-ls通过以root身份运行它,你没有/user/root文件夹,你必须创建它。hdfsdfs-mkdirmayank您没有/user/root/文件夹,因此无法在其中创建目录。你应该改为执行hdfsdfs

hadoop - 无法使用 Hadoop 命令创建目录?

我一直在启动NameNode和DataNode,但是当我尝试使用HDFS命令创建目录(在任何地方)时,它不起作用。这是我的命令:./hdfsdfs-mkdir-p/usr/master/datas我还尝试更改我的路径格式:./hdfsdfs-mkdir-p"/usr/master/datas"但我得到了相同的结果。我刚刚开始学习大数据。谁能告诉我如何解决这个问题以及如何调试这个问题? 最佳答案 /usr在HDFS上不存在。那是一个Unix目录。HDFS中的用户目录是/user。此外,您需要成为HDFSsuper用户才能在根路径下创建

java - Hadoop 的命令 start-dfs.sh 显示一个奇怪的错误

当我尝试运行下面的命令时,弹出一个错误Alis-Mac:hadoop-2.7.3naziaimran$sbin/start-dfs.sh错误如下,2018-06-0501:04:31.424java[1879:21215]UnabletoloadrealminfofromSCDynamicStore18/06/0501:04:31WARNutil.NativeCodeLoader:Unabletoloadnative-hadooplibraryforyourplatform...usingbuiltin-javaclasseswhereapplicableStartingnamenod