mahout-recommender

hadoop - Mahout 中的逻辑回归\SVM 实现

我目前正在为一家电信公司的数据进行Twitter数据的情感分析。我正在将数据加载到HDFS中，并使用Mahout的朴素贝叶斯分类器将情感预测为正面、负面或中性。这是我正在做的我正在向机器提供训练数据(key:sentiment,value:text)。使用mahout库通过计算文本的tf-idf(逆文档频率)创建特征向量。mahoutseq2sparser-i/user/root/new_model/dataseq--maxDFPercent1000000--minSupport4--maxNGramSize2-aorg.apache.lucene.analysis.Whitespac

hadoop Mahout 贝叶 section new_model machine-learning svm logistic-regression

hadoop - 使用项目相似度 hadoop 作业具有预先计算的项目相似度的基于可扩展实时项目的 mahout 推荐器？

我有以下设置:bool数据:(userid,itemid)基于hadoop的mahoutitemSimilarityJob具有以下参数:--similarityClassnameSimilarity_Loglikelihood--maxSimilaritiesPerItem50&others(input,output..)基于项目的bool推荐器:-模型MySqlBooleanPrefJDBCDataModel-相似性MySQLJDBCInMemoryItemSimilarity-candidatestrategyAllSimilarItemsCandidateItemsStrateg

hadoop 预先的 section rescorer machine-learning mahout

apache - 如何在 Windows 8.1 上安装 Mahout？

我的目标是建立一个推荐系统，在浏览了很多文章之后，我发现Mahout是一种简单而有效的方法。我的系统上已经安装了XAMPP。如何安装Mahout？我需要完整的说明，因为我以前既没有使用过cygwin，也没有使用过Hadoop，而且在我看到的任何地方，我都经常看到这两个。我首先需要在我的本地主机上安装它，然后再在服务器上安装它。最佳答案这里是在Windows中使用Hadoop安装ApacheMahout的详细说明页面。这有点乏味，但无论如何都可以完成。http://alans.se/blog/2010/mahout-on-hado

何在 Windows section strong Mahout apache hadoop cygwin

hadoop - 我应该使用哪个版本的 HDP 来处理 Mahout 0.9 和 Hadoop 1.x

我需要为一个项目使用Mahout0.9。据说Mahout0.9与hadoop1.x兼容很好，与hadoop2.x兼容有些问题。因此我需要Mahout0.9和hadoop1.x。根据消息来源，默认情况下HDP1.3.3具有Mahout0.7。我可以在安装HDP1.3.3后将Mahout升级到0.9吗？如果Mahout0.9与hadoop2.x配合良好，那么就没有问题。但是有人可以向我保证这一点吗。最佳答案在2014年4月发布的HortonWorksDataPlatform(2.1)的最新版本中，支持Mahout0.9。我将maho

hadoop Mahout section bigdata hortonworks-data-platform

hadoop - 如何使用 Mahout 的序列文件 API 代码？

在Mahout中存在一个创建序列文件的命令为bin/mahoutseqdirectory-cUTF-8-i-o.我想将此命令用作代码API。最佳答案你可以这样做:importorg.apache.hadoop.conf.Configuration;importorg.apache.hadoop.fs.FileSystem;importorg.apache.hadoop.fs.Path;importorg.apache.hadoop.io.SequenceFile;importorg.apache.hadoop.io.Text;C

hadoop Mahout apache code sequencefile

hadoop - 无法在 Mahout 中实例化类型 Cluster、KMean 聚类示例

您好，我试图在Mahout中运行KmeanClusteringExample，但遇到了示例代码中的错误。我在下面的代码片段中遇到错误集群cluster=newCluster(vec,i,newEuclideanDistanceMeasure());报错CannotinstantiatetheTypeCluster(这是一个接口(interface)，我的理解)。我想在我的样本数据集上运行kmeans，任何人都可以指导我吗？我在我的EClipseIDE中包含了以下Jarmahout-math-0.7-cdh4.3.0.jarhadoop-common-2.0.0-cdh4.2.1.jar

Cluster hadoop import new apache compiler-errors mahout k-means

java - 如何在操作书中的 mahout 中运行示例

我正在尝试运行第7章中的helloworld示例。我在eclipse中创建了以下内容，然后将其打包到一个jar中:-packagecom.mycode.mahoutimportjava.io.File;importjava.io.IOException;importjava.util.ArrayList;importjava.util.List;importorg.apache.hadoop.conf.Configuration;importorg.apache.hadoop.fs.FileSystem;importorg.apache.hadoop.fs.Path;importorg

中运何在 mahout java import eclipse hadoop jar

hadoop - 弹性 MapReduce 上的 Mahout : Java Heap Space

我在AmazonElasticMapReduce集群上从命令行运行Mahout0.6，试图canopy-cluster~1500个短文档，但作业一直失败并显示“错误:Java堆空间”消息。根据之前在这里和其他地方的问题，我调高了我能找到的每个内存旋钮:conf/hadoop-env.sh:在小实例上将所有堆空间设置为1.5GB，在大实例上甚至设置为4GB。conf/mapred-site.xml:添加mapred.{map,reduce}.child.java.opts属性，并将它们的值设置为-Xmx4000m$MAHOUT_HOME/bin/mahout:增加JAVA_HEAP_MA

MapReduce hadoop JobClient mapred INFO heap-memory amazon-emr mahout

hadoop - 当我尝试在 Apache Mahout 中运行示例时出现此错误是什么意思？

我使用mahout配置并运行示例，但出现以下错误:hadoopbinaryisnotinPATH,HADOOP_HOME/bin,HADOOP_PREFIX/bin,runninglocallyErroroccurredduringinitializationofVM在我的.bashrc中，我定义了以下别名:JAVA_HOME,HADOOP_CONF_DIR,MAHOUT_CONF_DIR,HADOOP_HOME我已经在/etc/bash.bashrc中配置了它:exportJAVA_HOME=/usr/lib/jvm/java-6-openjdk-i386exportPATH=$PA

中运时出 code HADOOP section config mahout

java - Mahout : java. lang.NumberFormatException:对于输入字符串:

我正在尝试让象夫工作，但出现以下错误:3/05/1622:48:53INFOmapred.MapTask:recordbuffer=262144/32768013/05/1622:48:53WARNmapred.LocalJobRunner:job_local_0001java.lang.NumberFormatException:Forinputstring:"1119"atjava.lang.NumberFormatException.forInputString(NumberFormatException.java:65)atjava.lang.Long.parseLong(Lo

NumberFormatException java hadoop apache mahout

14 15 161718 19 20