草庐IT

java - 是否可以在没有 hadoop 依赖的情况下使用 apache mahout?

是否可以在不依赖Hadoop的情况下使用Apachemahout。我想通过在我的Java项目中只包含mahout库来在一台计算机上使用mahout算法,但我根本不想使用hadoop,因为我将在单个节点上运行。这可能吗? 最佳答案 是的。并非所有的Mahout都依赖于Hadoop,尽管有很多。如果你使用依赖于Hadoop的一block,当然你需要Hadoop。但是例如,有大量的推荐引擎代码库没有使用Hadoop。您可以在Java程序中嵌入本地Hadoop集群/worker。 关于java-

java - Hadoop、Mahout实时处理替代方案

我打算在我的项目中使用hadoop作为“计算集群”。但是后来我读到Hadoop不适用于实时系统,因为与工作开始相关的开销。我正在寻找可以以这种方式使用的解决方案-可以轻松扩展到多台机器但不需要太多输入数据的作业。更重要的是我想使用机器学习工作,例如实时使用之前创建的神经网络。为此我可以使用哪些库/技术? 最佳答案 你说得对,Hadoop是为批处理类型设计的。看到这个问题,我想到了Twitter最近开源的Storm框架,它可以被认为是“用于实时处理的Hadoop”。Stormmakesiteasytowriteandscalecomp

【AI大数据】大规模数据集处理必备:Apache Mahout介绍、应用及优化

文章目录大规模数据集处理必备:ApacheMahout介绍、算法原理数学公式、代码实例应用及优化ApacheMahout介绍Mahout算法原理数学公式聚类算法K-Means算法MeanShift算法分类算法决策树算法朴素贝叶斯算法推荐算法协同过滤算法Mahout代码实例应用Mahout优化技巧总结作者:禅与计算机程序设计艺术大规模数据集处理必备:ApacheMahout介绍、算法原理数学公式、代码实例应用及优化ApacheMahout介绍ApacheMahout是一个用于构建可扩展机器学习算法的开源框架。Mahout使用Hado

Python 中 Java 的 Mahout 等价物

JavabasedMahout's目标是构建可扩展的机器学习库。Python中是否有任何等效的库? 最佳答案 强烈推荐学习scikitshttp://scikit-learn.sourceforge.net/ 关于Python中Java的Mahout等价物,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/4819437/

Python 中 Java 的 Mahout 等价物

JavabasedMahout's目标是构建可扩展的机器学习库。Python中是否有任何等效的库? 最佳答案 强烈推荐学习scikitshttp://scikit-learn.sourceforge.net/ 关于Python中Java的Mahout等价物,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/4819437/

springboot集成mahout实现简单基于协同过滤算法的文章推荐算法

文章目录参考文章前言1.建表并且生成一些数据首先,建立一个用户文章操作表(user_article_operation)使用casewhen语句简单统计数据2.代码与测试只需要根据表生成相应实体类(注意要加一个value属性来存储分数)主要代码如下,其实就两个方法userArticleOperationMapper.getAllUserPreference()方法收集数据mapper文件如下测试算法3.核心代码(基于用户分析)更新:相关代码放gitee了,sql与测试类在如下位置https://gitee.com/hwp_ing/mahout.git参考文章1.springboot项目基于ma

java - 如何在本地模式下运行 mahout kmeans 算法

是否可以在本地运行一个mahoutkmeanjava程序,以便它从本地读取数据并将其保存回本地文件系统而不是hdfs。互联网上的所有考试都在hdfs上进行。https://github.com/tdunning/MiA/blob/master/src/main/java/mia/clustering/ch07/SimpleKMeansClustering.java 最佳答案 是的,这是可能的-检查SequenceFileWriter。请参阅以下代码示例,它将集群数据点写入文件。这是一个blog详细描述了这一点的帖子:publicst

hadoop - 如何设计 Mahout 代码以在 MapReduce 上工作?

我打算使用LogLikelihoodSimilarity,它是Mahout中基于项目的算法。但我不知道如何在分布式模式上运行这个算法。MapReduce是否与算法集成,因此我不必为map()和reduce()编写代码? 最佳答案 MapReduce代码是在您用Java编写程序时自动生成的。您不必关心任何map()或reduce()方法。 关于hadoop-如何设计Mahout代码以在MapReduce上工作?,我们在StackOverflow上找到一个类似的问题:

hadoop - 如何让 mahout 与 hadoop HDFS 交互

我使用的是HDPmahout0.8版。我已经设置了MAHOUT_LOCAL=""。当我运行mahout时,我看到消息HADOOPLOCALNOTSETRUNNINGONHADOOP但我的程序没有将输出写入HDFS目录。谁能告诉我如何让我的mahout程序从HDFS获取输入并将输出写入HDFS? 最佳答案 您是否设置了$MAHOUT_HOME/bin和$HADOOP_HOME/bin在路径上?例如在Linux上:exportPATH=$PATH:$MAHOUT_HOME/bin/:$HADOOP_HOME/bin/exportHADO

hadoop - Mahout 随机森林示例,无法识别数据的命令行参数

命令:hadoopjar/opt/cloudera/parcels/CDH-5.0.0-1.cdh5.0.0.p0.47/lib/mahout/mahout-examples-0.8-cdh5.0.0-job.jarorg.apache.mahout.classifier.df.mapreduce.BuildForest–dadvert-train.csv–dsadvert-info–t100-oadvert-model产生错误:org.apache.commons.cli2.OptionException:Unexpected–dwhileprocessingOptions这似乎不可