草庐IT

nlp - 词形还原与词干提取有什么区别?

我什么时候使用每个?另外...NLTK词形还原是否依赖于词性?如果是这样不是更准确吗? 最佳答案 短而密:http://nlp.stanford.edu/IR-book/html/htmledition/stemming-and-lemmatization-1.htmlThegoalofbothstemmingandlemmatizationistoreduceinflectionalformsandsometimesderivationallyrelatedformsofawordtoacommonbaseform.However

php - 是否有用于 PHP 的词形还原器?

关闭。这个问题不符合StackOverflowguidelines.它目前不接受答案。要求我们推荐或查找工具、库或最喜欢的场外资源的问题对于StackOverflow来说是偏离主题的,因为它们往往会吸引自以为是的答案和垃圾邮件。相反,describetheproblem以及迄今为止为解决该问题所做的工作。关闭8年前。Improvethisquestion有谁知道lemmatizer在PHP中?或者,最坏的情况是,在PHPwebapp中使用另一种语言(例如pythonNLTK?)的词形还原器?我正在buildamacro-etymologicalanalyzer我遇到过词源数据库不包含共

python - 非英语单词的词形还原?

我想应用词形还原来减少单词的变形形式。我知道WordNet为英语语言提供了这样的功能,但我也有兴趣对荷兰语、法语、西类牙语和意大利语单词应用词形还原。有没有值得信赖和确认的方法来解决这个问题?谢谢! 最佳答案 试试CLIPS的pattern库,它们支持德语、英语、西类牙语、法语和意大利语。正是您所需要的:http://www.clips.ua.ac.be/pattern不幸的是,它只适用于Python2,尚未提供对Python3的支持。 关于python-非英语单词的词形还原?,我们在S

python - python中的wordnet词形还原和pos标记

我想在python中使用wordnetlemmatizer,我了解到默认的pos标记是NOUN,并且它不会为动词输出正确的lemma,除非pos标记明确指定为VERB。我的问题是,为了准确地执行上述词形还原,最好的方法是什么?我使用nltk.pos_tag进行了pos标记,但在将树库pos标签与wordnet兼容的pos标签集成时我迷失了。请帮忙fromnltk.stem.wordnetimportWordNetLemmatizerlmtzr=WordNetLemmatizer()tagged=nltk.pos_tag(tokens)我得到了NN,JJ,VB,RB中的输出标签。如何将这

java - 词形还原 java

已结束。此问题不符合StackOverflowguidelines.它目前不接受答案。我们不允许提出有关书籍、工具、软件库等方面的建议的问题。您可以编辑问题,以便用事实和引用来回答它。关闭7年前。Improvethisquestion我正在寻找lemmatisation在Java中实现英语。我已经找到了一些,但我需要一些不需要太多内存来运行的东西(最高1GB)。谢谢。我不需要词干分析器。 最佳答案 StanfordCoreNLPJava库包含一个占用少量资源的词形还原器,但我已在我的笔记本电脑上运行它,并且RAM使用它:Downlo
12