草庐IT

porter-stemmer

全部标签

java - 使用 Lucene 提取英语单词

我正在一个Java应用程序中处理一些英文文本,我需要对它们进行词干处理。例如,从文本“amenities/amenity”我需要得到“amenit”。函数如下:StringstemTerm(Stringterm){...}我找到了LuceneAnalyzer,但它看起来太复杂了,无法满足我的需求。http://lucene.apache.org/java/2_2_0/api/org/apache/lucene/analysis/PorterStemFilter.html有没有办法在不构建分析器的情况下使用它来词干?我不了解所有Analyzer业务...编辑:我实际上需要词干提取+词形还

java - 使用 Lucene 提取英语单词

我正在一个Java应用程序中处理一些英文文本,我需要对它们进行词干处理。例如,从文本“amenities/amenity”我需要得到“amenit”。函数如下:StringstemTerm(Stringterm){...}我找到了LuceneAnalyzer,但它看起来太复杂了,无法满足我的需求。http://lucene.apache.org/java/2_2_0/api/org/apache/lucene/analysis/PorterStemFilter.html有没有办法在不构建分析器的情况下使用它来词干?我不了解所有Analyzer业务...编辑:我实际上需要词干提取+词形还

Android ColorFilter - Porter-Duff 模式

我正在尝试解决androidColorFilters的问题。文档很差,所以主要方法是尝试不同的变体。问题:有一个位图。一些像素的alpha=255,其他像素的alpha=0。我正在尝试绘制一个具有特定颜色的圆圈。我希望位图中的alphachannel不变,但在绘制时我想将颜色乘以位图alpha。因此,在绘制圆圈时,我希望不绘制alpha=0的像素,而将alpha=255的像素绘制成我想要的颜色。Alphachannel不应改变。我正在尝试使用porter-duffColorFilter(androidsdk中的PorterDuffColorFilter类)。官网模式太多,描述看不懂:h

java - 是否有 Porter2 词干分析器的 java 实现

您知道Porter2词干分析器的任何java实现(或任何用java编写的更好的词干分析器)吗?我知道这里有一个Java版本的Porter(不是Porter2):http://tartarus.org/~martin/PorterStemmer/java.txt但是在http://tartarus.org/~martin/PorterStemmer/作者提到Porter有点过时并建议使用Porter2,可在http://snowball.tartarus.org/algorithms/english/stemmer.html但是,我的问题是这个Porter2是用snowball写的(我以

java - Porter 和 Lancaster Stemming 算法的主要区别和优势是什么?

关闭。这个问题需要更多focused.它目前不接受答案。想要改进这个问题吗?更新问题,使其只关注一个问题editingthispost.关闭6年前。Improvethisquestion我正在处理java中的文档分类任务。强烈推荐这两种算法,每种算法的优缺点是什么?哪种算法在自然语言处理任务的文献中更常用? 最佳答案 在它的基础上,porter和lancaster词干提取算法之间的主要区别在于,lancaster词干提取器比porter词干提取器更具侵略性。目前使用的三种主要词干提取算法是Porter、Snowball(Porter

ruby - gem 构建 "recipe for target ' stemmer.so' 失败”

当使用geminstalljekyll从gem安装Jekyll时,出现以下构建错误。我在Windows7上使用Cygwin,并在安装之前从源代码构建了posix-spawngem。Buildingnativeextensions.Thiscouldtakeawhile...ERROR:Errorinstallingjekyll-1.1.2.gem:ERROR:Failedtobuildgemnativeextension./usr/bin/ruby.exeextconf.rbcreatingMakefilemakegcc-I.-I/usr/include/ruby-1.9.1/x86_
12