背景:我正在尝试比较成对的单词,以查看在美国英语中哪对单词比另一对单词“更有可能出现”。我的计划是/曾经是使用NLTK中的搭配工具对单词对进行评分,得分较高的对最有可能。方法:我使用NLTK在Python中编写了以下代码(为简洁起见,删除了几个步骤和导入):bgm=nltk.collocations.BigramAssocMeasures()finder=BigramCollocationFinder.from_words(tokens)scored=finder.score_ngrams(bgm.likelihood_ratio)printscored结果:然后,我使用2个单词对检查
Python的第5章NLTKbook给出这个在句子中标注单词的例子:>>>text=nltk.word_tokenize("Andnowforsomethingcompletelydifferent")>>>nltk.pos_tag(text)[('And','CC'),('now','RB'),('for','IN'),('something','NN'),('completely','RB'),('different','JJ')]nltk.pos_tag调用默认标记器,它使用一整套标记。后面的章节asimplifiedsetoftags被介绍了。如何使用这组简化的词性标签来标记句
Python的第5章NLTKbook给出这个在句子中标注单词的例子:>>>text=nltk.word_tokenize("Andnowforsomethingcompletelydifferent")>>>nltk.pos_tag(text)[('And','CC'),('now','RB'),('for','IN'),('something','NN'),('completely','RB'),('different','JJ')]nltk.pos_tag调用默认标记器,它使用一整套标记。后面的章节asimplifiedsetoftags被介绍了。如何使用这组简化的词性标签来标记句
WordNet很棒,但我很难在nltk中找到同义词。如果您搜索类似于here之类的“小”一词,它显示了所有的同义词。基本上我只需要知道以下内容:wn.synsets('word')[i].option()其中option可以是上位词也可以是反义词,但是获取同义词的选项是什么? 最佳答案 如果您想要同义词集中的同义词(也就是构成该集合的引理),您可以使用lemma_names()获得它们:>>>forssinwn.synsets('small'):>>>print(ss.name(),ss.lemma_names())small.n.
WordNet很棒,但我很难在nltk中找到同义词。如果您搜索类似于here之类的“小”一词,它显示了所有的同义词。基本上我只需要知道以下内容:wn.synsets('word')[i].option()其中option可以是上位词也可以是反义词,但是获取同义词的选项是什么? 最佳答案 如果您想要同义词集中的同义词(也就是构成该集合的引理),您可以使用lemma_names()获得它们:>>>forssinwn.synsets('small'):>>>print(ss.name(),ss.lemma_names())small.n.
我正在尝试创建一种类似英语的小型语言来指定任务。基本思想是将语句拆分为动词和名词短语,这些动词应适用。我正在使用nltk,但没有得到我希望的结果,例如:>>>nltk.pos_tag(nltk.word_tokenize("selectthefilesandcopytoharddrive'"))[('select','NN'),('the','DT'),('files','NNS'),('and','CC'),('copy','VB'),('to','TO'),("harddrive'",'NNP')]>>>nltk.pos_tag(nltk.word_tokenize("moveth
我正在尝试创建一种类似英语的小型语言来指定任务。基本思想是将语句拆分为动词和名词短语,这些动词应适用。我正在使用nltk,但没有得到我希望的结果,例如:>>>nltk.pos_tag(nltk.word_tokenize("selectthefilesandcopytoharddrive'"))[('select','NN'),('the','DT'),('files','NNS'),('and','CC'),('copy','VB'),('to','TO'),("harddrive'",'NNP')]>>>nltk.pos_tag(nltk.word_tokenize("moveth
有没有办法使用NLTKWordNet找到专有名词?即,我可以使用nltkWordnet标记所有格名词吗? 最佳答案 我认为您不需要WordNet来查找专有名词,我建议使用词性标注器pos_tag。要查找专有名词,请查找NNP标签:fromnltk.tagimportpos_tagsentence="MichaelJacksonlikestoeatatMcDonalds"tagged_sent=pos_tag(sentence.split())#[('Michael','NNP'),('Jackson','NNP'),('likes'
有没有办法使用NLTKWordNet找到专有名词?即,我可以使用nltkWordnet标记所有格名词吗? 最佳答案 我认为您不需要WordNet来查找专有名词,我建议使用词性标注器pos_tag。要查找专有名词,请查找NNP标签:fromnltk.tagimportpos_tagsentence="MichaelJacksonlikestoeatatMcDonalds"tagged_sent=pos_tag(sentence.split())#[('Michael','NNP'),('Jackson','NNP'),('likes'
我正在按照类作业的说明进行操作,并且我应该在文本文件中查找最常用的200个单词。这是代码的最后一部分:fdist1=FreqDist(NSmyText)vocab=fdist1.keys()vocab[:200]但是当我在vocab200行之后按enter时,它会返回:Traceback(mostrecentcalllast):File"",line1,inTypeError:'dict_keys'objectisnotsubscriptable有关如何解决此问题以便正确返回答案的任何建议? 最佳答案 看起来您使用的是Python3