nltk_草庐IT

php - 使用 PHP 进行文本挖掘

关闭。这个问题不符合StackOverflowguidelines.它目前不接受答案。我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题，以便用事实和引用来回答。关闭7年前。Improvethisquestion我正在为我正在上的大学类(class)做一个项目。我正在使用PHP构建一个简单的Web应用程序，它根据一组词典将推文分类为“正面”(或快乐)和“负面”(或悲伤)。我现在想到的算法是朴素贝叶斯分类器或决策树。但是，我找不到任何可以帮助我进行一些严肃的语言处理的PHP库。Python有NLTK(http://www.nltk.org)。PHP有类似的东西吗？我打算使用WE

挖掘 php section class notice nlp data-mining nltk weka

创建一个默认的标记python nltk

我正在尝试使用NLTK在Python上创建一个默认标签，但我继续收到错误。由爱沙尼亚语中的单词组成的语料库，其重点是标记每个单词的语音一部分。我的代码：fromnltk.corpus.readerimportTaggedCorpusReadermypath="/Users/mmo/Downloads/"EC=TaggedCorpusReader(mypath,"estonianSmall_copy.txt",encoding="latin-1")sents=EC.tagged_sents()fromnltkimportDefaultTaggerfromnltk.probabilityimpor

标记创建 code FreqDist section

python - 在 Google App Engine 上使用 Python NLTK (2.0b5)

我一直在尝试使NLTK(自然语言工具包)在GoogleAppEngine上运行。我遵循的步骤是:下载安装程序并运行它(一个.dmg文件，因为我使用的是Mac)。从pythonsite-packages目录中复制nltk文件夹并将其作为子文件夹放置在我的项目文件夹中。在包含nltk子文件夹的文件夹中创建一个python模块并添加以下行:fromnltk.tokenizeimport*不幸的是，在启动它后，我收到了这个错误(请注意，这个错误在NLTK中很深，我在我的系统安装python时看到它，而不是在GAE项目的子文件夹中的那个)::NomodulenamednltkTraceback(

python Google section nltk 1.335654715894946084 google-app-engine nlp

python - 在 Google App Engine 上使用 Python NLTK (2.0b5)

我一直在尝试使NLTK(自然语言工具包)在GoogleAppEngine上运行。我遵循的步骤是:下载安装程序并运行它(一个.dmg文件，因为我使用的是Mac)。从pythonsite-packages目录中复制nltk文件夹并将其作为子文件夹放置在我的项目文件夹中。在包含nltk子文件夹的文件夹中创建一个python模块并添加以下行:fromnltk.tokenizeimport*不幸的是，在启动它后，我收到了这个错误(请注意，这个错误在NLTK中很深，我在我的系统安装python时看到它，而不是在GAE项目的子文件夹中的那个)::NomodulenamednltkTraceback(

python Google section nltk 1.335654715894946084 google-app-engine nlp

python - 用 Python 在句子列表中形成单词的 Bigrams

我有一个句子列表:text=['cantrailwaystation','citadelhotel','policestn'].我需要形成二元对并将它们存储在一个变量中。问题是当我这样做时，我得到的是一对句子而不是单词。这是我所做的:text2=[[wordforwordinline.split()]forlineintext]bigrams=nltk.bigrams(text2)print(bigrams)产生[(['cant','railway','station'],['citadel','hotel']),(['citadel','hotel'],['police','stn'

句子单词 39 section code python list list-comprehension nltk collocation

python - 用 Python 在句子列表中形成单词的 Bigrams

我有一个句子列表:text=['cantrailwaystation','citadelhotel','policestn'].我需要形成二元对并将它们存储在一个变量中。问题是当我这样做时，我得到的是一对句子而不是单词。这是我所做的:text2=[[wordforwordinline.split()]forlineintext]bigrams=nltk.bigrams(text2)print(bigrams)产生[(['cant','railway','station'],['citadel','hotel']),(['citadel','hotel'],['police','stn'

句子单词 39 section code python list list-comprehension nltk collocation

python - Python NLTK 中的 Vader 'compound' 极性分数是如何计算的？

我正在使用VaderSentimentAnalyzer来获取极性分数。我之前使用了正/负/中性的概率分数，但我刚刚意识到“复合”分数，范围从-1(最负)到1(最正)将提供一个单一的极性度量。我想知道“复合”分数是如何计算的。是从[pos,neu,neg]向量计算的吗？最佳答案 VADER算法将情绪分数输出到4类情绪https://github.com/nltk/nltk/blob/develop/nltk/sentiment/vader.py#L441:否定:否定neu:中性pos:正面compound:复合(即总分)让我们看一下

amp compound code nltk sentiment python nlp sentiment-analysis vader

python - Python NLTK 中的 Vader 'compound' 极性分数是如何计算的？

我正在使用VaderSentimentAnalyzer来获取极性分数。我之前使用了正/负/中性的概率分数，但我刚刚意识到“复合”分数，范围从-1(最负)到1(最正)将提供一个单一的极性度量。我想知道“复合”分数是如何计算的。是从[pos,neu,neg]向量计算的吗？最佳答案 VADER算法将情绪分数输出到4类情绪https://github.com/nltk/nltk/blob/develop/nltk/sentiment/vader.py#L441:否定:否定neu:中性pos:正面compound:复合(即总分)让我们看一下

amp compound code nltk sentiment python nlp sentiment-analysis vader

python - 估计句子之间的 'approximate'语义相似度有哪些好方法？

在过去的几个小时里，我一直在查看SO上的nlp标签，并且确信我没有遗漏任何内容，但如果我遗漏了，请指出我的问题。不过，与此同时，我将描述我正在尝试做的事情。我在许多帖子中观察到的一个常见概念是语义相似性很困难。例如，来自this发布后，接受的解决方案建议如下:Firstofall,neitherfromtheperspectiveofcomputationallinguisticsnoroftheoreticallinguisticsisitclearwhattheterm'semanticsimilarity'meansexactly.....Considertheseexample

句子 approximate noreferrer section noopener python nlp machine-learning data-mining nltk

python - 估计句子之间的 'approximate'语义相似度有哪些好方法？

在过去的几个小时里，我一直在查看SO上的nlp标签，并且确信我没有遗漏任何内容，但如果我遗漏了，请指出我的问题。不过，与此同时，我将描述我正在尝试做的事情。我在许多帖子中观察到的一个常见概念是语义相似性很困难。例如，来自this发布后，接受的解决方案建议如下:Firstofall,neitherfromtheperspectiveofcomputationallinguisticsnoroftheoreticallinguisticsisitclearwhattheterm'semanticsimilarity'meansexactly.....Considertheseexample

句子 approximate noreferrer section noopener python nlp machine-learning data-mining nltk