草庐IT

mahout-recommender

全部标签

hadoop - Hbase 0.96 与 Mahout 0.9 集成

是否可以使用Hbase0.96版本作为Mahout0.9版本的数据源?示例:-在Hbase表上运行Mahout。我正在使用具有以下配置的系统:-Ubuntu14.04-64位架构。提前致谢。 最佳答案 根据您的标签,我假设您是在询问Mahout推荐系统。您可以编写代码来获取所有用户的所有项目矩阵,无论是密集矩阵还是稀疏矩阵(密集矩阵为0,其中不存在偏好强度,稀疏矩阵将忽略任何0值)这里有一些幻灯片描述了如何将Hbase与Mahout结合使用:http://www.slideshare.net/cloudera/hbasecon-20

java - Mahout 在行动 : Chapter 06: Wikipedia job fails with java. lang.ArrayIndexOutOfBoundsException

我使用的hadoop版本是$hadoopversionHadoop2.5.0-cdh5.2.0Subversionhttp://github.com/cloudera/hadoop-re1f20a08bde76a33b79df026d00a0c91b2298387Compiledbyjenkinson2014-10-11T21:00ZCompiledwithprotoc2.5.0Fromsourcewithchecksum309bccd135b199bdfdd6df5f3f4153dThiscommandwasrunusing/DCNFS/applications/cdh/5.2/ap

php - 如何将搜索引擎连接到 mahout

我有一个搜索引擎,我希望它只搜索特殊词,例如,当您搜索cvitaminsthe时,搜索引擎应该带来内容,当您点击内容时,它应该带来它的危害方面。例如c维生素对blahblah不好。是否可以将用php创建的搜索引擎连接到Apachemahout? 最佳答案 为什么要使用mahout?我不确定您的情况,请提供更多详细信息。从你的描述中,我得到的印象是你有点想推荐一个staticdata。我的意思是所有内容和危害方面都已预先填充并保存在某个地方,然后您可以根据搜索查询获取信息。是这样吗?如果是,那么我认为您不需要Mahout。如果这不是您

hadoop - 没有来自 mahout 的输出文件

我正在syncfusion中的hadoop上运行一个mahoutrecommenderJob。我得到以下信息。但是没有输出...好像是无限期运行有谁知道为什么我没有从中得到output.txt?为什么这似乎无限期地运行? 最佳答案 我怀疑这可能是由于您机器中的磁盘空间不足所致,在这种情况下,我建议您清理磁盘空间并从您这端重试。另外,我还建议您使用SyncfusionClusterManager-您可以使用它来形成具有多个节点/机器的集群,以便有足够的内存可用于执行您的工作。-兰库玛 关于

maven - 错误:无法找到或加载主类org.apache.mahout.driver.MahoutDriver

我试图运行以下语句:代码:/usr/local/lib/mahout/bin$mahoutseqwiki-i/user/wiki/enwiki-articles.xml-o/user/wiki/kmeansseqfiles错误:MAHOUT_LOCALisset,sowedon'taddHADOOP_CONF_DIRtoclasspath.MAHOUT_LOCALisset,runninglocallyError:Couldnotfindorloadmainclassorg.apache.mahout.driver.MahoutDriver我遵循了这个stackoverflowpage

java - 当我尝试在 Apache Mahout 中运行示例时,此错误告诉我们什么?

我正在学习使用ApacheMahout,在运行其中一个示例后得到以下消息:Exceptioninthread"main"org.apache.hadoop.mapreduce.lib.input.InvalidInputException:Inputpathdoesnotexist:file:/home/user1/workspace/LDAAnalysis/output/data其实运行后发现*/output/data目录就创建在那里了。我不明白这条错误消息告诉我们什么? 最佳答案 第一个大问题是“什么例子”?有些人会在本地工作,

hadoop - mahout 不会启动。与 hadoop 和 mahout 之间的兼容版本有什么关系?

我是hadoop的新手,更不用说mahout了。我希望有人可以帮助我通过这里..已经尝试了2天..我已经有一个hadoop集群在运行。我正在使用hadoop-2.0.0-alpha。我安装了mahout(ahout-distribution-0.7)和maven-2.2.1(最新的maven-3.0.4不起作用)现在我只想运行mahout来了解它是什么。我了解到,通过键入“mahout”,它将打印出mahout中可用的选项(算法)列表,但是当我键入mahout时,它只会给我Java异常。$[hadoop@localhostbin]$mahoutMAHOUT_LOCALisnotset;

amazon-web-services - 如何计算映射器/缩减器的数量,以最大限度地提高在亚马逊云上运行的 mahout Recommender Job 的性能?

根据AmazonElasticMapReduce上使用/可用的实例,计算要使用的正确hadoop映射器和缩减器数量的最佳方法是什么?(使用mahout-core-0.7发行版的RecommenderJob) 最佳答案 通用的Hadoop答案适用:让Hadoop选择映射器的数量将reducer的数量设置为等于集群中reduce插槽的数量对于EMR,查看在您使用的实例类型上默认运行的reducer数量:http://docs.aws.amazon.com/ElasticMapReduce/latest/DeveloperGuide/Ha

hadoop - 如何在不耗尽内存的情况下运行大型 Mahout 模糊 kmeans 聚类?

我在Amazon的EMR(AMI2.3.1)上运行Mahout0.7模糊k-means集群,并且我的内存不足。我的总体问题:如何最轻松地让它发挥作用?这是一个调用:./bin/mahoutfkmeans\--inputs3://.../foo/vectors.seq\--outputs3://.../foo/fuzzyk2\--numClusters128\--clusterss3://.../foo/initial_clusters/\--maxIter20\--m2\--methodmapreduce\--distanceMeasureorg.apache.mahout.commo

vector - java.lang.OutOfMemoryError : Java heap space error while running seq2sparse in mahout 错误

我正在尝试在mahout中使用k-means对一些手工制作的日期进行聚类。我创建了6个文件,每个文件中几乎没有1或2个单词的文本。使用./mahoutseqdirectory从它们中创建一个序列文件。在尝试使用./mahoutseq2sparse命令将序列文件转换为向量时,出现java.lang.OutOfMemoryError:Javaheapspace错误。序列文件大小为0.215KB。命令:./mahoutseq2sparse-imokha/output-omokha/vector-ow错误日志:SLF4J:ClasspathcontainsmultipleSLF4Jbindin