example_site_visit

java - 配置pentaho的hdfs-vfs来获取hdfs-site.xml

我刚开始使用Pentaho'sHDFSVFS并且对这个项目了解不多。我正在尝试从外部位置读取我的Hadoop配置文件。这似乎适用于除hdfs-site.xml之外的所有文件.尝试通过PentahoHDFSVFS项目与HDFS通信时，故障发生在VFS层。我的直觉告诉我pentaho正在通过一些环境变量或其他外部指针读取这个文件，但我似乎无法在他们的源代码中找到它。当我手动将hdfs-site.xml文件放入已编译的war时一切正常文件，但这对我来说不够，因为我需要将此文件放在外部位置，以便其他进程可以更改它。有没有人处理过这个问题？有人可以让我知道如何告诉pentaho从哪里获取这个文件

hadoop - Spark : ClassNotFoundException when running KafkaWordCount example

我在使用以下命令在我的CDH5集群上使用kafka运行sparkstreaming时遇到问题:spark-submit--masteryarn--deploy-modeclient--classorg.apache.spark.examples.streaming.KafkaWordCount/usr/lib/spark/examples/lib/spark-examples-1.6.0-cdh5.7.0-hadoop2.6.0-cdh5.7.0.jarzk1,zk2,zk3grouptopic1请注意，真正的工作必须在客户端模式下运行，因此部署模式设置。执行上述命令会导致以下异常(驱

ClassNotFoundException KafkaWordCount hadoop spark SparkSubmit apache-spark apache-kafka hadoop-yarn spark-streaming

hadoop - 如果没有在hdfs-site.xml中定义，namenode和datanode安装在哪里？

我的hdfs-site.xml只有以下内容:dfs.replication1问题。NameNode和DataNode安装在哪里？我在装有Windows10的MSFTSurface笔记本电脑上使用Hadoop3.0.3版本。最佳答案在hdfs-default.xmldfs.datanode.data.dir默认值为file://${hadoop.tmp.dir}/dfs/data和dfs.namenode.name。目录file://${hadoop.tmp.dir}/dfs/name并且在core-default.xmlhado

hdfs-site datanode code hadoop section hdfs namenode hadoop3

hadoop - 编辑 yarn-site.xml 时需要重新加载 yarn 吗？

我已经在我的集群上编辑了yarn-site.xml。具体来说，我编辑了yarn.scheduler.minimum-allocation-mb设置。我是否需要以某种方式重新加载配置，或者重新启动资源管理器或其他东西才能生效，或者这些配置文件是否会自动监视和重新加载？最佳答案是的，你有。您还可以使用Ambari验证这一点。yarn-site.xml文件中的一项编辑会触发某些服务重新启动。YARN就是其中之一关于hadoop-编辑yarn-site.xml时需要重新加载yarn吗？，我

yarn yarn-site section hadoop hadoop-yarn

hadoop - HDInsight hadoop-mapreduce-examples.jar 输出在哪里？

我在HDInsight中运行示例wordcount应用程序命令成功运行，但我找不到输出。我运行的命令是hadoopjarhadoop-mapreduce-examples.jarwordcount/example/data/gutenberg/davinci.txt/user/joe/WordCountOutput我期待在文件系统上创建一些东西。但我没有看到/user/joe/创建。请指教。最佳答案默认情况下，HDInsight使用Azureblob存储作为其HDFS存储，因此您的输出位于与集群关联的存储帐户中。你可以使用类似C

hadoop hadoop-mapreduce-examples section mapreduce hdfs azure-hdinsight

hadoop - 你可以用 hadoop-mapreduce-examples-2.2.0.jar 做什么？

关闭。这个问题需要detailsorclarity.它目前不接受答案。想改进这个问题吗？通过editingthispost添加细节并澄清问题.关闭8年前。Improvethisquestion我是Hadoop的新手，想了解安装时附带的jar文件。我一直在使用hadoop-mapreduce-examples-2.2.0.jar运行wordcount测试。一切进展顺利，但我想知道除了wordcount之外，我还能用这个jar文件或其他可用的jar文件做什么？

hadoop hadoop-mapreduce-examples section class notice

configuration - HBaseConfiguration 不读取我在 ${HBASE_HOME}/conf/hbase-site.xml 中设置的值

${HBASE_HOME}/conf/hbase-site.xml有下一个值:hbase.zookeeper.quorumhd1“hd1”主机名设置在“/etc/hosts”中，ping正常...使用这个简单的Java程序:importorg.apache.hadoop.conf.Configuration;importorg.apache.hadoop.hbase.HBaseConfiguration;publicclassTestConfigurator{/***@paramargs*/publicstaticvoidmain(String[]args){Configuration

中设 HBaseConfiguration code section conf configuration hadoop hbase

当我尝试在 YARN 上运行 pi-example 时，Hadoop2.5.2 卡在了 Running Job

我在3台装有UbuntuServer14.04的机器上运行Hadoop2.5.2一个是namenode和resourcemanager，ip是192.168.3.1其他的是运行datanode和nodemanager的slave，ip分别是192.168.3.102和192.168.3.104。我可以毫无错误地运行start-hdfs.sh和start-yarn.sh。HDFS和YARN的网站运行良好，我可以在浏览器上访问这两个网站并查看两个从站的状态。但是当我尝试通过yarnjarhadoop-mapreduce-examples-2.5.2.jarpi14在~/hadoop/sha

pi-example Hadoop2 gt lt property hadoop hadoop-yarn

hadoop - Spark 1.3.0 : Running Pi example on YARN fails

我有Hadoop2.6.0.2.2.0.0-2041和Hive0.14.0.2.2.0.0-2041使用命令构建Spark后:mvn-Pyarn-Phadoop-2.4-Dhadoop.version=2.6.0-Phive-Phive-thriftserver-DskipTestspackage我尝试使用以下命令在YARN上运行Pi示例:exportHADOOP_CONF_DIR=/etc/hadoop/conf/var/home2/test/spark/bin/spark-submit\--classorg.apache.spark.examples.SparkPi\--maste

Running example hadoop yarn 1427875242006 apache-spark hadoop-yarn

hadoop - 如何在不重启集群的情况下更新 hadoop mapred-site.xml 的配置参数

我想添加/更新以下参数mapred.map.tasks.speculative.executionfalse在hadoop的mapred-site.xml中。如何在不重启集群的情况下执行此操作？最佳答案您可以在您的作业配置中设置每个作业。如果您想全局更改此行为，则必须重新启动集群。如果不重新启动，则无法更改它。关于hadoop-如何在不重启集群的情况下更新hadoopmapred-site.xml的配置参数，我们在StackOverflow上找到一个类似的问题：

hadoop 何在 section mapred

39 40 414243 44 45