MAHOUT

java - ClassNotFoundException org.apache.mahout.math.VectorWritable

我正在尝试将csv文件转换为序列文件，以便我可以对数据进行训练和运行分类器。我有一个我编译的作业java文件，然后jar到mahout作业jar中。当我尝试hadoopjar我在mahoutjar中的工作时，我得到一个java.lang.ClassNotFoundException:org.apache.mahout.math.VectorWritable。我不确定这是为什么，因为如果我查看mahoutjar，该类确实存在。这是我正在做的步骤#getnewcopyofmahoutjarrmiris.jarcp/home/stephen/home/libs/mahout-distribu

hadoop - 如何创建我自己的 RecommenderJob？

我找到了一些关于如何创建我自己的非分布式推荐系统的教程，但没有找到如何创建我自己的分布式推荐系统作业的教程(如果您知道，欢迎提供任何链接)。在“MahoutinAction”一书中有一些如何使用Mahout的对象编写Mappers/Reducers的示例，但似乎没有说明如何将这些工作放在一起？但是在mahout-core中有item/RecommenderJob给出了如何做到这一点的想法。我的实际意图是替换第一个映射器，这样我就不必在mahout之外准备我的数据(行看起来像“userid、itemid1、itemid2、itemid3...”并使用item.RecommenderJob

RecommenderJob hadoop section itemid mapreduce mahout

hadoop - 在 Mahout 中运行 Breiman 示例时出现 java.lang.ClassNotFoundException

我正在尝试在单个系统(伪分布式模式)上运行Breiman示例，该示例为Mahout中的分类构建决策林。我指的是thistutorial我对本教程的前两步没有问题，但第三步(“为数据集生成文件描述符”)抛出异常，如下所示Exceptioninthread"main"java.lang.ClassNotFoundException:org.apache.mahout.classifier.df.tools.Describeatjava.net.URLClassLoader$1.run(URLClassLoader.java:366)atjava.net.URLClassLoader$1.r

中运时出 java URLClassLoader section hadoop mahout

ruby-on-rails - 复杂算法应该在哪里进行计算

背景:我是一名软件工程专业的学生，我正在检查推荐系统的几种算法。这些算法之一，协同过滤有很多循环，它必须遍历所有用户，并且对于每个用户，他对电影或其他可评分项目的所有评分。我正在考虑在Rails应用程序的Ruby上实现它。关键是有很多数据要处理，所以:这应该在数据库中完成吗？使用常规查询？使用PL/SQL或类似的东西(测试数据库非常耗时且困难，特别是对于这些算法)我应该做一个缓存算法结果的后台作业吗？(如果是这样，数据是在内存中处理的，如果有数百万用户，这个规模有多好)我应该在每次有请求时运行算法还是每x个请求运行一次算法？(同样，数据是在内存中处理的)问题:我知道有些东西可以做到

ruby-on-rails rails section 的中运 hadoop scalability mahout

windows - PriviledgedActionException 无法设置路径的权限

我有没有cygwin的窗口和mahout的单元测试，并且这个测试在它期间启动hadoop作业我有下一个异常(exception):Jul9,20135:21:23AMorg.apache.hadoop.util.NativeCodeLoaderWARNING:Unabletoloadnative-hadooplibraryforyourplatform...usingbuiltin-javaclasseswhereapplicableJul9,20135:21:23AMorg.slf4j.impl.JCLLoggerAdapterinfoINFO:BuildClustersInput:

PriviledgedActionException windows mahout TestClusterDumper hadoop

hadoop - canopy聚类算法中如何增加reducer的数量

我正在使用mahout运行树冠聚类算法。这是我通过mahout命令行运行的命令。mahoutcanopy-i/mahout/o_seqsparse/tfidf-vectors-o/mahout/o_canopy-dmorg.apache.mahout.common.distance.SquaredEuclideanDistanceMeasure-ow-t1100-t250下面是map&reduce任务运行的数量:没有。maptask运行-->6没有。reducetask运行-->1但是因为一个reducer，这花费了太多时间。我想，如果我能够增加reduce任务的数量，那么我会获得更好

reducer hadoop strong section mapreduce mahout canopy

mongodb - hadoop-mongodb 驱动程序和 mahout

我使用hadoop-mongodb驱动程序在mongodb之上设置了hadoop。目前我可以成功地将M/R作业的结果输出到mongo集合。我想使用mahout来利用一些提供的算法。是否可以在mongodb之上使用mahout并直接输出到mongo集合？有我可以阅读的方法或示例吗？最佳答案是的，但它与Mahout没有直接关系。您以选择MongoDB位置的方式指定输入和输出URL。剩下的就是Hadoop-Mongo集成和设置的问题。关于mongodb-hadoop-mongodb驱动程

mongodb hadoop-mongodb section hadoop mahout

java - 使用 Hadoop 的机器学习框架

关闭。这个问题不符合StackOverflowguidelines.它目前不接受答案。要求我们推荐或查找工具、库或最喜欢的场外资源的问题对于StackOverflow来说是偏离主题的，因为它们往往会吸引自以为是的答案和垃圾邮件。相反，describetheproblem以及迄今为止为解决该问题所做的工作。关闭9年前。Improvethisquestion除了Mahout之外，还有哪些其他框架可以在JAVA中实现机器学习算法，以便底层框架采用JAVA代码并在Hadoop上运行它？我正在寻找Mahout的替代方案，因为我需要SVM和Hadoop上的凝聚集群实现，而Mahout仅支持SVM。

Hadoop java section class notice mapreduce machine-learning mahout

Hadoop:在 Apache Mahout 中实现贝叶斯算法时出错

我在Mahout中执行贝叶斯算法时遇到问题。我用Maven构建它，作业文件在目标目录中。使用Hadoop从终端运行时，出现ClassNotFoundException错误。应该怎么办？$HADOOP_HOME/bin/hadoopjarmahout-core-0.3-SNAPSHOT.joborg.apache.mahout.classifier.bayes.mapreduce.bayes.bayesdriver-itest-ooutputExceptioninthread"main"java.lang.ClassNotFoundException:org.apache.mahout.

时出贝叶 java section ClassLoader hadoop hadoop2 mahout bayesian

apache - 使用 apache mahout 算法的开源应用程序

我正在使用hadoop开发一个项目。现在我想在hadoop上测试一个数据密集型应用程序。我检查了apachemahout机器学习算法。是否有使用apahcemahout机器学习算法在hadoop上运行的开源应用程序？最佳答案您可以从观看官方Mahout页面开始-PoweredbyMahout您可以在其中找到Mahout软件的商业和学术用途列表。我想其中一些应该是开源的，但我自己还没有检查过。关于apache-使用apachemahout算法的开源应用程序，我们在StackOverf

apache mahout section hadoop machine-learning

1 234 5 6