草庐IT

java - 如何从谷歌翻译短语手册中获取单词?

我需要一些方法在谷歌翻译中从我的短语手册中获取单词。我怎样才能从GoogleTranslatePhasebook中获取所有单词?是否有任何javaapi? 最佳答案 尝试使用Firebug查看GET/POST参数,然后在Java中寻找类似Curl的东西来发送这些参数,最后解析HTTP响应。谷歌翻译使用ajax发送和接收HTTP请求,而Firebug是最好的工具。 关于java-如何从谷歌翻译短语手册中获取单词?,我们在StackOverflow上找到一个类似的问题:

java - 如何使用 Open nlp 的分块解析器提取名词短语

我是自然语言处理的新手。我需要从文本中提取名词短语。到目前为止,我已经使用opennlp的分block解析器来解析我的文本以获得树结构。但我无法提取名词来自树结构的短语,opennlp中是否有任何正则表达式模式,以便我可以用它来提取名词短语。下面是我使用的代码InputStreamis=newFileInputStream("en-parser-chunking.bin");ParserModelmodel=newParserModel(is);Parserparser=ParserFactory.create(model);ParsetopParses[]=ParserTool.pa

java - 短语查询和使用 shingle 过滤器有什么区别?

我目前正在使用lucene索引网页。目的是能够快速提取哪个页面包含某个表达式(通常是1、2或3个词),以及页面中还包含哪些其他词(或其中的1到3个词组)。这将用于构建/丰富/更改词库(固定词汇)。从我找到的文章来看,问题似乎是找到n-grams(或木瓦)。Lucene有一个ShingleFilter,一个ShingleMatrixFilter,和一个ShingleAnalyzerWrapper,这似乎与此任务有关。从这里presentation,我了解到Lucene还可以搜索由固定数量的单词(称为slops)分隔的术语。提供了一个例子here.但是,我不清楚这些方法之间的区别?它们是根

java - 使用斯坦福类型的解析器从文本文件中提取名词短语

我有一段文本,我想从中提取名词短语。我可以很容易地获得我所拥有的文本的类型化解析器,但想知道如何提取文本中的名词短语? 最佳答案 您可以使用以下代码从Tree中提取名词短语。它假定您已经解析了存储在parse中的句子(即parse是LexicalizedParser类应用方法的输出)publicstaticListGetNounPhrases(){ListphraseList=newArrayList();for(Treesubtree:parse){if(subtree.label().value().equals("NP")){

python - Spacy 提取特定名词短语

我可以在python中使用spacy来查找具有特定邻居的NP吗?我想要我的文本中前后都有动词的名词短语。 最佳答案 您可以合并名词短语(这样它们就不会被单独标记)。分析依赖解析树,并查看相邻标记的POS。>>>importspacy>>>nlp=spacy.load('en')>>>sent=u'runpythonprogramrun,tomakethiswork'>>>parsed=nlp(sent)>>>list(parsed.noun_chunks)[pythonprogram]>>>fornoun_phraseinlist(

python - 如何提取句子中的主语及其各自的从属短语?

我正在尝试在句子中提取主题,以便根据主题获得情感。我正在使用nltk在python2.7中用于此目的。以下面这句话为例:DonaldTrumpistheworstpresidentofUSA,butHillaryisbetterthanhim他我们可以看到DonaldTrump和Hillary是两个主题,以及与DonaldTrump相关的情绪是负数但与Hillary有关是积极的。到现在为止,我已经能够将这个句子分解成大块的名词短语,并且能够得到以下内容:(S(NPDonald/NNPTrump/NNP)is/VBZ(NPthe/DTworst/JJSpresident/NN)in/IN

python - 在 Python 中使用 while 函数将短语更改为向量

我想用sklearn将以下短语更改为向量:Article1.ItisnotgoodtoeatpizzaaftermidnightArticle2.Iwouldn'tsurviveadaywithouthstackexchangeArticle3.AllofthesearejustrandomphrasesArticle4.Toproveifmyexperimentworks.Article5.Thereddogjumpsoverthelazyfox我得到了以下代码:fromsklearn.feature_extraction.textimportCountVectorizervecto

python - 统计机器翻译的短语提取算法

我用SMT的短语提取算法编写了以下代码。GitHub#-*-coding:utf-8-*-defphrase_extraction(srctext,trgtext,alignment):"""Phraseextractionalgorithm."""defextract(f_start,f_end,e_start,e_end):phrases=set()#return{}iffend==0iff_end==0:return#forall(e,f)∈Adofore,finalignment:#return{}ifeeendifee_end:returnfs=f_start#repeat-

python - Tensorflow:使用神经网络对正面或负面短语进行分类

我正在按照这里的教程进行操作:https://pythonprogramming.net/train-test-tensorflow-deep-learning-tutorial/我可以训练神经网络并打印出准确度。但是,我不知道如何使用神经网络进行预测。这是我的尝试。具体问题是这一行-我相信我的问题是我无法将我的输入字符串转换为模型期望的格式:features=get_features_for_input("Thiswasthebeststorei'veeverseen.")result=(sess.run(tf.argmax(prediction.eval(feed_dict={x:

python - 用 nltk 搜索相似的意思短语

我有一堆不相关的段落,我需要遍历它们以找到类似的事件,例如,在我寻找objectfalls的地方进行搜索,我为包含以下内容的文本找到一个bool值True:箱子从架子上掉下来灯泡在地上碎了一block石膏从天花板上掉下来并且False用于:责任落在莎拉身上温度突然下降我可以使用nltk来标记、标记并获得Wordnetsynsets,但我发现很难弄清楚如何将nltk的移动部件组合在一起以达到预期的结果。在寻找同义词集之前我应该​​chunk吗?我应该写一个上下文无关语法吗?从treebank标签翻译成Wordnet语法标签时是否有最佳实践?nltkbook中均未对此进行解释,我在nltk