mahout-recommender

hadoop - Hbase 0.96 与 Mahout 0.9 集成

是否可以使用Hbase0.96版本作为Mahout0.9版本的数据源？示例:-在Hbase表上运行Mahout。我正在使用具有以下配置的系统:-Ubuntu14.04-64位架构。提前致谢。最佳答案根据您的标签，我假设您是在询问Mahout推荐系统。您可以编写代码来获取所有用户的所有项目矩阵，无论是密集矩阵还是稀疏矩阵(密集矩阵为0，其中不存在偏好强度，稀疏矩阵将忽略任何0值)这里有一些幻灯片描述了如何将Hbase与Mahout结合使用:http://www.slideshare.net/cloudera/hbasecon-20

java - Mahout 在行动 : Chapter 06: Wikipedia job fails with java. lang.ArrayIndexOutOfBoundsException

我使用的hadoop版本是$hadoopversionHadoop2.5.0-cdh5.2.0Subversionhttp://github.com/cloudera/hadoop-re1f20a08bde76a33b79df026d00a0c91b2298387Compiledbyjenkinson2014-10-11T21:00ZCompiledwithprotoc2.5.0Fromsourcewithchecksum309bccd135b199bdfdd6df5f3f4153dThiscommandwasrunusing/DCNFS/applications/cdh/5.2/ap

ArrayIndexOutOfBoundsException java hadoop apache mahout wikipedia mahout-recommender

php - 如何将搜索引擎连接到 mahout

我有一个搜索引擎，我希望它只搜索特殊词，例如，当您搜索cvitaminsthe时，搜索引擎应该带来内容，当您点击内容时，它应该带来它的危害方面。例如c维生素对blahblah不好。是否可以将用php创建的搜索引擎连接到Apachemahout？最佳答案为什么要使用mahout？我不确定您的情况，请提供更多详细信息。从你的描述中，我得到的印象是你有点想推荐一个staticdata。我的意思是所有内容和危害方面都已预先填充并保存在某个地方，然后您可以根据搜索查询获取信息。是这样吗？如果是，那么我认为您不需要Mahout。如果这不是您

mahout php section code mysql hadoop mahout-recommender

hadoop - 没有来自 mahout 的输出文件

我正在syncfusion中的hadoop上运行一个mahoutrecommenderJob。我得到以下信息。但是没有输出...好像是无限期运行有谁知道为什么我没有从中得到output.txt？为什么这似乎无限期地运行？最佳答案我怀疑这可能是由于您机器中的磁盘空间不足所致，在这种情况下，我建议您清理磁盘空间并从您这端重试。另外，我还建议您使用SyncfusionClusterManager-您可以使用它来形成具有多个节点/机器的集群，以便有足够的内存可用于执行您的工作。-兰库玛关于

hadoop mahout section image strong syncfusion mahout-recommender

maven - 错误:无法找到或加载主类org.apache.mahout.driver.MahoutDriver

我试图运行以下语句：代码：/usr/local/lib/mahout/bin$mahoutseqwiki-i/user/wiki/enwiki-articles.xml-o/user/wiki/kmeansseqfiles错误：MAHOUT_LOCALisset,sowedon'taddHADOOP_CONF_DIRtoclasspath.MAHOUT_LOCALisset,runninglocallyError:Couldnotfindorloadmainclassorg.apache.mahout.driver.MahoutDriver我遵循了这个stackoverflowpage

MahoutDriver apache mahout root xml maven ubuntu hadoop classnotfoundexception

java - 当我尝试在 Apache Mahout 中运行示例时，此错误告诉我们什么？

我正在学习使用ApacheMahout，在运行其中一个示例后得到以下消息:Exceptioninthread"main"org.apache.hadoop.mapreduce.lib.input.InvalidInputException:Inputpathdoesnotexist:file:/home/user1/workspace/LDAAnalysis/output/data其实运行后发现*/output/data目录就创建在那里了。我不明白这条错误消息告诉我们什么？最佳答案第一个大问题是“什么例子”？有些人会在本地工作，

中运 Apache section code java hadoop mapreduce mahout

hadoop - mahout 不会启动。与 hadoop 和 mahout 之间的兼容版本有什么关系？

我是hadoop的新手，更不用说mahout了。我希望有人可以帮助我通过这里..已经尝试了2天..我已经有一个hadoop集群在运行。我正在使用hadoop-2.0.0-alpha。我安装了mahout(ahout-distribution-0.7)和maven-2.2.1(最新的maven-3.0.4不起作用)现在我只想运行mahout来了解它是什么。我了解到，通过键入“mahout”，它将打印出mahout中可用的选项(算法)列表，但是当我键入mahout时，它只会给我Java异常。$[hadoop@localhostbin]$mahoutMAHOUT_LOCALisnotset;

hadoop mahout java

amazon-web-services - 如何计算映射器/缩减器的数量，以最大限度地提高在亚马逊云上运行的 mahout Recommender Job 的性能？

根据AmazonElasticMapReduce上使用/可用的实例，计算要使用的正确hadoop映射器和缩减器数量的最佳方法是什么？(使用mahout-core-0.7发行版的RecommenderJob) 最佳答案通用的Hadoop答案适用:让Hadoop选择映射器的数量将reducer的数量设置为等于集群中reduce插槽的数量对于EMR，查看在您使用的实例类型上默认运行的reducer数量:http://docs.aws.amazon.com/ElasticMapReduce/latest/DeveloperGuide/Ha

射器缩减 section 的 amazon-web-services hadoop mahout reducers mapper

hadoop - 如何在不耗尽内存的情况下运行大型 Mahout 模糊 kmeans 聚类？

我在Amazon的EMR(AMI2.3.1)上运行Mahout0.7模糊k-means集群，并且我的内存不足。我的总体问题:如何最轻松地让它发挥作用？这是一个调用:./bin/mahoutfkmeans\--inputs3://.../foo/vectors.seq\--outputs3://.../foo/fuzzyk2\--numClusters128\--clusterss3://.../foo/initial_clusters/\--maxIter20\--m2\--methodmapreduce\--distanceMeasureorg.apache.mahout.commo

耗尽何在 java apache hadoop cluster-analysis mahout k-means

vector - java.lang.OutOfMemoryError : Java heap space error while running seq2sparse in mahout 错误

我正在尝试在mahout中使用k-means对一些手工制作的日期进行聚类。我创建了6个文件，每个文件中几乎没有1或2个单词的文本。使用./mahoutseqdirectory从它们中创建一个序列文件。在尝试使用./mahoutseq2sparse命令将序列文件转换为向量时，出现java.lang.OutOfMemoryError:Javaheapspace错误。序列文件大小为0.215KB。命令:./mahoutseq2sparse-imokha/output-omokha/vector-ow错误日志:SLF4J:ClasspathcontainsmultipleSLF4Jbindin

OutOfMemoryError seq2sparse apache hadoop org vector mahout

10 11 121314 15 16