独立性

java - 为什么 spark 在本地或独立模式下需要 hadoop 库？

我下载了spark-2.4.0-bin-without-hadoop.tgz包并安装在我的系统中。我想在本地模式下运行简单的apachespark代码，但它给了我NoClassDefFoundError。Exceptioninthread"main"java.lang.NoClassDefFoundError:org/apache/hadoop/conf/ConfigurationCausedby:java.lang.ClassNotFoundException:org.apache.hadoop.conf.Configuration谷歌搜索后，我发现SPARK_DIST_CLASSP

java - Hadoop Java程序始终以独立模式运行

我编写了一个使用Hadoop的Java程序。我使用“java-jarprog.jar”从命令行执行我的程序，我可以看到它以独立模式运行。我可以这么说，因为JobTracker和TaskTracker守护进程不需要运行我的程序就能成功执行。如果我使用“hadoopjarprog.jar”(关闭map/reduce守护进程)执行我的程序，它自然不会工作。我希望我的java程序以伪分布式模式执行，但我感觉它找不到配置文件。我尝试将其执行为“java-cp/usr/hadoop-1.1.1/conf-jarprog.jar”，以便将其指向配置文件所在的位置，但仍然没有骰子。我感觉类路径有问题。

Hadoop java code section mapreduce classpath

hadoop - Hbase:从独立模式迁移到全分布式模式

如果可能的话，我想在Hbase中从独立模式迁移到完全分布式模式。我有一些独立模式的数据，我想在迁移期间保留这些数据。请帮忙。最佳答案很老的问题，但最近我遇到了同样的问题并使用以下步骤解决了它:在独立模式下要迁移的导出表:bin/hbaseorg.apache.hadoop.hbase.mapreduce.Driverexporttable_name/local/path/table_name_backup在伪分布式/分布式模式下使用hadoop在hdfs中复制表:./bin/hadoopfs-copyFromLocal/loca

hadoop Hbase section table_name_backup

authentication - 如何在 flink 独立安装上进行 kerberos 身份验证？

我有一个独立的Flink安装，我想在其上运行一个将数据写入HDFS安装的流作业。HDFS安装是Cloudera部署的一部分，需要Kerberos身份验证才能读取和写入HDFS。由于我没有找到关于如何使Flink与受Kerberos保护的HDFS连接的文档，因此我不得不对该过程进行一些有根据的猜测。这是我到目前为止所做的:我为我的用户创建了一个key表文件。在我的Flink作业中，我添加了以下代码:UserGroupInformation.loginUserFromKeytab("myusername","/path/to/keytab");最后，我使用TextOutputFormat将

authentication 何在 code apache hadoop kerberos apache-flink

java - 在独立模式下组装hadoop时出现Maven错误

我是hadoop和maven的新手。我想从源代码编译hadoop2.0.3并安装它。我正在按照指示http://hadoop.apache.org/docs/current/hadoop-project-dist/hadoop-common/SingleCluster.html到目前为止，我已经成功下载了hadoop源代码并从源目录发出“mvncleaninstall-Pnative”接下来我尝试执行mvnassembly:assembly，但出现以下错误:无法在项目hadoop-main上执行目标org.apache.maven.plugins:maven-assembly-plug

时出 hadoop section java

python - 在 ubuntu hadoop 独立安装 HUE 时找不到模块 saml2

我已经安装了libsaml包，但make仍然失败。我是python的新手，绝对路径的东西，一般的python模块的东西，但我想学习它!任何提示将不胜感激!提前致谢。/Hue/“制作应用程序”中的最后几行代码是这样的:Installed/home/hadoop/hue/desktop/libs/indexer/srcmake[2]:Leavingdirectory/home/hadoop/hue/desktop/libs/indexer'Regeneratingdatabaseat/home/hadoop/hue/desktop/desktop.dbSyncing/updatingdat

python hadoop desktop home makefile hue

java - 如何编写可以使用 "hadoop -jar"运行的独立 YARN 应用程序？

我必须在Hadoop集群中运行一些无法用Map/Reduce表达的东西。我想到了为它编写一个YARN应用程序。我发现了SpringYarn对于spring-boot并遵循入门指南(请参阅链接)。到目前为止，这是有效的，但存在一些缺陷:在教程中生成了三个JAR(一个用于客户端，一个用于appmaster，一个用于容器)，在提交应用程序时它们必须位于特定的文件夹结构中我必须在application.yml中对HDFSURI和资源管理器主机/端口进行硬编码，或者将它们作为命令行参数提供由于它是基于SpringBoot，应用程序是用java-jar启动的，所以创建的JAR文件非常大，里面基本上

amp 编写 code li section java hadoop hadoop-yarn

maven - 使用 Local Runner 在独立模式下运行 Hadoop 2.4.0 作业的单元测试

在使用以前版本的Hadoop时，我通常会为整个作业(映射器和缩减器)构建junit测试，并通过调用maven或直接从IDE本身运行测试。系统上的任何地方都没有安装hadoop。我使用以下属性来确保使用本地进程内运行器:config.set("mapred.job.tracker","local");config.set("fs.default.name","file:///test-fs");这些测试运行成功。我升级到较新版本的Hadoop(2.4.0)以利用新的API。我希望能够像以前一样用我的单元做同样的事情。我现在使用的属性是:config.set("fs.default.nam

Hadoop Runner java mapreduce maven unit-testing junit

java - hbase 独立快速启动失败可通过 maven 项目重复

我必须向私有(private)hadoop集群启动一个hbase进程，并且需要简单地演示最低限度的功能；演示不需要安装hadoop。按照QuickStartapachehbase文档通过shell失败，我已经能够使用自包含的maven项目复制失败。/etc/hosts不是问题。我找到了一个maven项目，它似乎是为deomnstrate这个相同的功能而构建的，并更新了deps。该项目在这里:hbase-demo要重复我的结果需要shell和安装了maven的两行:gitclonehttps://github.com/jnorthrup/hbase-democdhbase-demo$mv

可通 hbase zookeeper INFO java maven hadoop apache-zookeeper

hadoop - 在独立的 Hadoop 2.5.1 之上安装 Hue

我试图让Hue在独立的Hadoop2.5.1(Ubuntu14.04)上运行，但在运行服务器时遇到了问题。我遵循了本教程:http://gethue.com/how-to-build-hue-on-ubuntu-14-04-trusty/.当尝试wgethttp://localhost:8000我得到:hduser@ip-172-31-11-6:~/hue$wgetlocalhost:8000--2014-11-0100:40:45--http://localhost:8000/Resolvinglocalhost(localhost)...127.0.0.1Connectingtol

hadoop localhost section 8000 hue

78 79 808182 83 84