草庐IT

mahout-recommender

全部标签

hadoop - Mahout 中的逻辑回归\SVM 实现

我目前正在为一家电信公司的数据进行Twitter数据的情感分析。我正在将数据加载到HDFS中,并使用Mahout的朴素贝叶斯分类器将情感预测为正面、负面或中性。这是我正在做的我正在向机器提供训练数据(key:sentiment,value:text)。使用mahout库通过计算文本的tf-idf(逆文档频率)创建特征向量。mahoutseq2sparser-i/user/root/new_model/dataseq--maxDFPercent1000000--minSupport4--maxNGramSize2-aorg.apache.lucene.analysis.Whitespac

hadoop - 使用项目相似度 hadoop 作业具有预先计算的项目相似度的基于可扩展实时项目的 mahout 推荐器?

我有以下设置:bool数据:(userid,itemid)基于hadoop的mahoutitemSimilarityJob具有以下参数:--similarityClassnameSimilarity_Loglikelihood--maxSimilaritiesPerItem50&others(input,output..)基于项目的bool推荐器:-模型MySqlBooleanPrefJDBCDataModel-相似性MySQLJDBCInMemoryItemSimilarity-candidatestrategyAllSimilarItemsCandidateItemsStrateg

apache - 如何在 Windows 8.1 上安装 Mahout?

我的目标是建立一个推荐系统,在浏览了很多文章之后,我发现Mahout是一种简单而有效的方法。我的系统上已经安装了XAMPP。如何安装Mahout?我需要完整的说明,因为我以前既没有使用过cygwin,也没有使用过Hadoop,而且在我看到的任何地方,我都经常看到这两个。我首先需要在我的本地主机上安装它,然后再在服务器上安装它。 最佳答案 这里是在Windows中使用Hadoop安装ApacheMahout的详细说明页面。这有点乏味,但无论如何都可以完成。http://alans.se/blog/2010/mahout-on-hado

hadoop - 我应该使用哪个版本的 HDP 来处理 Mahout 0.9 和 Hadoop 1.x

我需要为一个项目使用Mahout0.9。据说Mahout0.9与hadoop1.x兼容很好,与hadoop2.x兼容有些问题。因此我需要Mahout0.9和hadoop1.x。根据消息来源,默认情况下HDP1.3.3具有Mahout0.7。我可以在安装HDP1.3.3后将Mahout升级到0.9吗?如果Mahout0.9与hadoop2.x配合良好,那么就没有问题。但是有人可以向我保证这一点吗。 最佳答案 在2014年4月发布的HortonWorksDataPlatform(2.1)的最新版本中,支持Mahout0.9。我将maho

hadoop - 如何使用 Mahout 的序列文件 API 代码?

在Mahout中存在一个创建序列文件的命令为bin/mahoutseqdirectory-cUTF-8-i-o.我想将此命令用作代码API。 最佳答案 你可以这样做:importorg.apache.hadoop.conf.Configuration;importorg.apache.hadoop.fs.FileSystem;importorg.apache.hadoop.fs.Path;importorg.apache.hadoop.io.SequenceFile;importorg.apache.hadoop.io.Text;C

hadoop - 无法在 Mahout 中实例化类型 Cluster、KMean 聚类示例

您好,我试图在Mahout中运行KmeanClusteringExample,但遇到了示例代码中的错误。我在下面的代码片段中遇到错误集群cluster=newCluster(vec,i,newEuclideanDistanceMeasure());报错CannotinstantiatetheTypeCluster(这是一个接口(interface),我的理解)。我想在我的样本数据集上运行kmeans,任何人都可以指导我吗?我在我的EClipseIDE中包含了以下Jarmahout-math-0.7-cdh4.3.0.jarhadoop-common-2.0.0-cdh4.2.1.jar

java - 如何在操作书中的 mahout 中运行示例

我正在尝试运行第7章中的helloworld示例。我在eclipse中创建了以下内容,然后将其打包到一个jar中:-packagecom.mycode.mahoutimportjava.io.File;importjava.io.IOException;importjava.util.ArrayList;importjava.util.List;importorg.apache.hadoop.conf.Configuration;importorg.apache.hadoop.fs.FileSystem;importorg.apache.hadoop.fs.Path;importorg

hadoop - 弹性 MapReduce 上的 Mahout : Java Heap Space

我在AmazonElasticMapReduce集群上从命令行运行Mahout0.6,试图canopy-cluster~1500个短文档,但作业一直失败并显示“错误:Java堆空间”消息。根据之前在这里和其他地方的问题,我调高了我能找到的每个内存旋钮:conf/hadoop-env.sh:在小实例上将所有堆空间设置为1.5GB,在大实例上甚至设置为4GB。conf/mapred-site.xml:添加mapred.{map,reduce}.child.java.opts属性,并将它们的值设置为-Xmx4000m$MAHOUT_HOME/bin/mahout:增加JAVA_HEAP_MA

hadoop - 当我尝试在 Apache Mahout 中运行示例时出现此错误是什么意思?

我使用mahout配置并运行示例,但出现以下错误:hadoopbinaryisnotinPATH,HADOOP_HOME/bin,HADOOP_PREFIX/bin,runninglocallyErroroccurredduringinitializationofVM在我的.bashrc中,我定义了以下别名:JAVA_HOME,HADOOP_CONF_DIR,MAHOUT_CONF_DIR,HADOOP_HOME我已经在/etc/bash.bashrc中配置了它:exportJAVA_HOME=/usr/lib/jvm/java-6-openjdk-i386exportPATH=$PA

java - Mahout : java. lang.NumberFormatException:对于输入字符串:

我正在尝试让象夫工作,但出现以下错误:3/05/1622:48:53INFOmapred.MapTask:recordbuffer=262144/32768013/05/1622:48:53WARNmapred.LocalJobRunner:job_local_0001java.lang.NumberFormatException:Forinputstring:"1119"atjava.lang.NumberFormatException.forInputString(NumberFormatException.java:65)atjava.lang.Long.parseLong(Lo