短语

java - 如何从谷歌翻译短语手册中获取单词？

我需要一些方法在谷歌翻译中从我的短语手册中获取单词。我怎样才能从GoogleTranslatePhasebook中获取所有单词？是否有任何javaapi？最佳答案尝试使用Firebug查看GET/POST参数，然后在Java中寻找类似Curl的东西来发送这些参数，最后解析HTTP响应。谷歌翻译使用ajax发送和接收HTTP请求，而Firebug是最好的工具。关于java-如何从谷歌翻译短语手册中获取单词？，我们在StackOverflow上找到一个类似的问题：

短语单词 section stackoverflow java google-translate

java - 如何使用 Open nlp 的分块解析器提取名词短语

我是自然语言处理的新手。我需要从文本中提取名词短语。到目前为止，我已经使用opennlp的分block解析器来解析我的文本以获得树结构。但我无法提取名词来自树结构的短语，opennlp中是否有任何正则表达式模式，以便我可以用它来提取名词短语。下面是我使用的代码InputStreamis=newFileInputStream("en-parser-chunking.bin");ParserModelmodel=newParserModel(is);Parserparser=ParserFactory.create(model);ParsetopParses[]=ParserTool.pa

短语 java code section nlp stanford-nlp opennlp

java - 短语查询和使用 shingle 过滤器有什么区别？

我目前正在使用lucene索引网页。目的是能够快速提取哪个页面包含某个表达式(通常是1、2或3个词)，以及页面中还包含哪些其他词(或其中的1到3个词组)。这将用于构建/丰富/更改词库(固定词汇)。从我找到的文章来看，问题似乎是找到n-grams(或木瓦)。Lucene有一个ShingleFilter,一个ShingleMatrixFilter,和一个ShingleAnalyzerWrapper，这似乎与此任务有关。从这里presentation，我了解到Lucene还可以搜索由固定数量的单词(称为slops)分隔的术语。提供了一个例子here.但是，我不清楚这些方法之间的区别？它们是根

短语 shingle noreferrer noopener java lucene information-retrieval

java - 使用斯坦福类型的解析器从文本文件中提取名词短语

我有一段文本，我想从中提取名词短语。我可以很容易地获得我所拥有的文本的类型化解析器，但想知道如何提取文本中的名词短语？最佳答案您可以使用以下代码从Tree中提取名词短语。它假定您已经解析了存储在parse中的句子(即parse是LexicalizedParser类应用方法的输出)publicstaticListGetNounPhrases(){ListphraseList=newArrayList();for(Treesubtree:parse){if(subtree.label().value().equals("NP")){

斯坦短语 section subtree java text nlp stanford-nlp opennlp

python - Spacy 提取特定名词短语

我可以在python中使用spacy来查找具有特定邻居的NP吗？我想要我的文本中前后都有动词的名词短语。最佳答案您可以合并名词短语(这样它们就不会被单独标记)。分析依赖解析树，并查看相邻标记的POS。>>>importspacy>>>nlp=spacy.load('en')>>>sent=u'runpythonprogramrun,tomakethiswork'>>>parsed=nlp(sent)>>>list(parsed.noun_chunks)[pythonprogram]>>>fornoun_phraseinlist(

短语 python 39 section nlp nltk spacy

python - 如何提取句子中的主语及其各自的从属短语？

我正在尝试在句子中提取主题，以便根据主题获得情感。我正在使用nltk在python2.7中用于此目的。以下面这句话为例:DonaldTrumpistheworstpresidentofUSA,butHillaryisbetterthanhim他我们可以看到DonaldTrump和Hillary是两个主题，以及与DonaldTrump相关的情绪是负数但与Hillary有关是积极的。到现在为止，我已经能够将这个句子分解成大块的名词短语，并且能够得到以下内容:(S(NPDonald/NNPTrump/NNP)is/VBZ(NPthe/DTworst/JJSpresident/NN)in/IN

主语从属 tok 34 39 python nlp nltk spacy

python - 在 Python 中使用 while 函数将短语更改为向量

我想用sklearn将以下短语更改为向量:Article1.ItisnotgoodtoeatpizzaaftermidnightArticle2.Iwouldn'tsurviveadaywithouthstackexchangeArticle3.AllofthesearejustrandomphrasesArticle4.Toproveifmyexperimentworks.Article5.Thereddogjumpsoverthelazyfox我得到了以下代码:fromsklearn.feature_extraction.textimportCountVectorizervecto

短语 python code section CountVectorizer scikit-learn

python - 统计机器翻译的短语提取算法

我用SMT的短语提取算法编写了以下代码。GitHub#-*-coding:utf-8-*-defphrase_extraction(srctext,trgtext,alignment):"""Phraseextractionalgorithm."""defextract(f_start,f_end,e_start,e_end):phrases=set()#return{}iffend==0iff_end==0:return#forall(e,f)∈Adofore,finalignment:#return{}ifeeendifee_end:returnfs=f_start#repeat-

短语 python start end phrase algorithm machine-learning nlp machine-translation

python - Tensorflow:使用神经网络对正面或负面短语进行分类

我正在按照这里的教程进行操作:https://pythonprogramming.net/train-test-tensorflow-deep-learning-tutorial/我可以训练神经网络并打印出准确度。但是，我不知道如何使用神经网络进行预测。这是我的尝试。具体问题是这一行-我相信我的问题是我无法将我的输入字符串转换为模型期望的格式:features=get_features_for_input("Thiswasthebeststorei'veeverseen.")result=(sess.run(tf.argmax(prediction.eval(feed_dict={x:

短语负面 features code current_words python machine-learning tensorflow neural-network

python - 用 nltk 搜索相似的意思短语

我有一堆不相关的段落，我需要遍历它们以找到类似的事件，例如，在我寻找objectfalls的地方进行搜索，我为包含以下内容的文本找到一个bool值True:箱子从架子上掉下来灯泡在地上碎了一block石膏从天花板上掉下来并且False用于:责任落在莎拉身上温度突然下降我可以使用nltk来标记、标记并获得Wordnetsynsets，但我发现很难弄清楚如何将nltk的移动部件组合在一起以达到预期的结果。在寻找同义词集之前我应该chunk吗？我应该写一个上下文无关语法吗？从treebank标签翻译成Wordnet语法标签时是否有最佳实践？nltkbook中均未对此进行解释，我在nltk

短语 python strong code section search nlp nltk

7 8 91011 12 13