草庐IT

macos - 在 Spark 和 Hadoop 之间共享数据(Mahout)

我的应用程序使用Spark进行一些数据处理并将其保存为RDD;我正在使用“本地”属性初始化SparkContext。我想在此数据集上使用Mahout,但在2个应用程序之间共享此数据的最佳方式是什么?我是大数据生态系统的新手,所以答案对我来说并不是很明显。附注我还在本指南的帮助下在本地安装了Hadoophttp://amodernstory.com/2014/09/23/installing-hadoop-on-mac-osx-yosemite/并能够运行它。 最佳答案 由于您的数据位于RDD中,因此只能从创建它的上下文中访问它,除非

macos - 无法找到或加载类 : org. apache.hadoop.hdfs.server.namenode.NameNode

我在我的mac上安装了hadoop,我按照hadoop安装一步一步来当我执行hdfsnamenode-formathadoop总是返回错误无法找到或加载类org.apache.hadoop.hdfs.server.namenode.NameNode这是我的/etc/profile:exportJAVA_HOME=/Library/Java/JavaVirtualMachines/jdk1.8.0_25.jdk/contents/homeexportJRE_HOME=$JAVA_HOME/jreexportCLASSPATH=$JAVA_HOME/lib:$JRE_HOME/lib:$C

macos - intelliJ IDEA 设置中的 Mac 上的 Hadoop

使用brew安装了hadoop,现在想在intelliJIDEA中运行hadoop作业。如何搭建环境和解决依赖? 最佳答案 在花了很多时间之后,终于可以从intelliJIDEA运行hadoop作业了。希望这可以为其他人节省时间。brewupgradehadoop在/usr/local/Cellar/hadoop/2.x.x安装/更新hadoop现在,我们将尝试从我们的intelliJ中的这个位置导入依赖项启动IntelliJ并点击“创建新项目”创建一个java项目转到文件->项目结构->在模块中选择项目模块->选择依赖项标签->选

macos - Cloudera CDH Mac

我参加了一个将使用ClouderaCDH和Hadoop等的类(class)。类(class)的当前设置涉及使用带有VirtualBox的虚拟机。我只是想知道是否有更快、更有效的程序实现可供我使用。该程序可以以某种方式安装在我的本地环境中吗?(我使用的是带有OSHighSierra的2017MacbookPro) 最佳答案 您可以在您的MacOs中以所谓的伪分布式模式安装Hadoop、Spark、Hive、Pig。它是本地机器上的一个安装,其中“集群”的每个节点都是一个Java虚拟机。起点是Hadoop安装,您可以按照本教程进行操作:

macos - Jobtracker UI 在 osx 上无法正常工作

Hadoop本身(即hdfs和map/reduce)正在工作-以及brew安装的配置单元(验证前两个)。只是GUI很奇怪:请参阅随附的屏幕截图:网络服务器已启动,但JobTracker未提供任何有用的信息找不到jobtracker.jsp:50030端口上的任何人(是!)namenodeui呢? 最佳答案 我在安装hadoop-2.0.0-cdh4.5.0时遇到了同样的错误。花了一些时间查看代码后,我设法通过将以下补丁应用到hadoop-common-2.0.0-cdh4.5.0.jar来使其正常工作:diff--gita/org/

macos - 我可以在运行 OS X 的 Macbook 上的 hadoop 上运行 MATLAB MapReduce 框架吗?

我正在尝试在Hadoop上运行Matlab的Mapreduce。我正在尝试将matlab中的环境变量设置为hadoop安装文件夹。setenv('HADOOP_HOME','/usr/local/bin/hadoop')但是我收到这个错误:Errorusingparallel.cluster.Hadoop(line111)Unabletorecognize'/Users/Hadoop/Documents/hadoop-2.7.2/'asavalidHADOOPinstallationfolder.CheckthatthisistherootofyourHADOOPinstallatio

macos - 在 Mac 上为 Hadoop 设置 JAVA_HOME

我在OSX10.7上为Hadoop正确设置JAVA_HOME时遇到问题这是我所做的:转到/usr/local/Cellar/hadoop/1.0.3/libexec/conf/hadoop-env.sh并更改JAVA_HOME表单,无论它在那里默认为exportJAVA_HOME=/Library/Java/Home/我对Java也很陌生,所以即使JAVA_HOME也可能是错误的。因此,通过转到hadoop的bin文件夹并运行此命令:hadoopjarhadoop-*-examples.jar这是我得到的讨厌的错误:Exceptioninthread"main"java.io.IOEx

macos - 无法在 OS X 10.8 上启动 Hadoop YARN 的节点管理器

启动所有其他节点后,当我尝试启动nodemanager时,它似乎已经打开然后自动终止。像下面这样:Yitongs-MacBook-Pro:hadooptimyitong$sbin/yarn-daemon.shstartnodemanagerstartingnodemanager,loggingto/Users/timyitong/Dev/hadoop/logs/yarn-timyitong-nodemanager-Yitongs-MacBook-Pro.local.outYitongs-MacBook-Pro:hadooptimyitong$jps8981DataNode9300Jps

macos - 在 Mac 中编译 Hadoop 示例

我是类Unix操作系统的新手。按照下面的说明安装Hadoop后,http://wiki.apache.org/hadoop/Running_Hadoop_On_OS_X_10.5_64-bit_(Single-Node_Cluster)我正在尝试使用相同的URL构建示例Ant例子这给了我一个异常(exception)编译映射类:试图覆盖任务jsp-compile的旧定义[javac]/Users/hadoop/hadoop-1.2.1/build.xml:549:警告:未设置“includeantruntime”,默认为build.sysclasspath=last;为可重复build

mysql - 将 mysqldump 添加到 MAMP(MacOS X 上的 MySQL/w Apache PHP)

我想知道如何将mysqldump添加到我的MAMP环境中。我用谷歌搜索了一下,只找到了社区MySQL服务器版本。但我不想安装另一个MySQL-基本上是因为我想先保存我的数据,然后再进行任何实验。 最佳答案 我自己找到了解决方案。也许这可以帮助其他Mac用户......事实上mysqldump与MAMP一起提供,但位于沙漠中的某个地方:/Applications/MAMP/Library/bin/mysqldump这就是为什么像MySQL工作台这样的工具找不到它的原因,它也不能在没有路径的终端中工作。所以最后只需输入:/Applica