草庐IT

java - 如何分析简单的英语句子

是否有可用于分析(nlp)简单英文文本的库。比如能做到就完美了;输入:“我要去”输出:I,go,现在进行时 最佳答案 NaturalLanguageToolkit怎么样?? 关于java-如何分析简单的英语句子,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/745334/

java - 在java中计算句子中每个单词的频率

我正在编写一个非常基本的java程序,用于计算句子中每个单词的出现频率,到目前为止我设法做到了这一点importjava.io.*;classLinked{publicstaticvoidmain(Stringargs[])throwsIOException{BufferedReaderbr=newBufferedReader(newInputStreamReader(System.in));System.out.println("Enterthesentence");Stringst=br.readLine();st=st+"";inta=lengthx(st);Stringarr[

java - 有没有办法使用 OpenNLP 获取句子的主题?

有没有办法使用OpenNLP获取句子的主语?我正在尝试确定用户句子中最重要的部分。通常,用户会向我们的“引擎”提交句子,而我们想确切地知道该句子的核心主题是什么。目前我们正在使用openNlp来:将句子分block识别句子中的名词短语、动词等识别句子的所有“主题”(尚未完成!)确定句子的“核心主题”如果您有任何好主意,请告诉我.. 最佳答案 依赖解析器如果您对提取语法关系感兴趣,例如什么词或短语是句子的主语,您真的应该使用dependencyparser.虽然OpenNLP确实支持短语结构解析,但我认为它还不支持依赖解析。开源软件用

java - 在 Java 中反转给定的句子

谁能告诉我如何编写Java程序来反转给定的句子?例如,如果输入是:"Thisisaninterviewquestion"输出必须是:"questioninterviewanisthis" 最佳答案 您将字符串按空格分开,然后向后遍历它以组装颠倒的句子。String[]words="Thisisinterviewquestion".split("");Stringrev="";for(inti=words.length-1;i>=0;i--){rev+=words[i]+"";}//rev="questioninterviewisTh

详细介绍Sentence-BERT:使用连体BERT网络的句子嵌入

Sentence-BERT:SentenceEmbeddingsusingSiameseBERT-Networks使用连体BERT网络的句子嵌入BERT和RoBERTa在诸如语义文本相似性(STS)的句子对回归任务上创造了新的最优的性能。然而,它要求将两个句子都输入网络,这导致了巨大的运算开销:在10,000个句子的集合中寻找最相似的一对,使用BERT需要大约5000万次推理计算(约65小时)。BERT的结构使它不适合语义相似性搜索以及像聚类这样的无监督任务。本文提出了Sentence-BERT(SBERT),这是一种对预训练的BERT网络的修改,它使用连体和三连体网络结构来推导出语义上有意义

python - 从一组给定的单词中造出一个有意义的句子

关闭。这个问题需要更多focused.它目前不接受答案。想改进这个问题吗?更新问题,使其只关注一个问题editingthispost.关闭6年前。Improvethisquestion我正在开发一个程序,该程序需要根据给定的一组单词创建语法正确的句子。在这里,我将向程序传递一个字符串列表的输入,我的输出应该是一个有意义的句子,由这些单词和其他一些必要的单词组成。例如。Input:{'You','House','Beautiful'}Output:'Yourhouseisbeautiful'(or)'youhouseisbeautiful'Input:{'Father','Love','

python - Python如何检查一个句子是否包含某个词然后执行一个 Action ?

假设我向用户询问原始输入,他们说,“这是一条消息。”如果该原始输入包含“消息”一词,它将在此之后执行一个操作。我可以看看如何做到这一点吗? 最佳答案 根据@knitti的评论,问题是你需要先将句子拆分成单词,然后检查:term="message"#termwewanttosearchforinput=raw_input()#readinputfromuserwords=input.split()#splitthesentenceintoindividualwordsifterminwords:#seeifoneofthewordsi

python - 枚举python中的句子

我有一个由两个句子组成的字符串元组a=('What','happened','then','?','What','would','you','like','to','drink','?')我试过了fori,jinenumerate(a):printi,j给出0What1happened2then3?4What5would6you7like8to9drink10?而我需要的是这个0What1happened2then3?0What1would2you3like4to5drink6? 最佳答案 最简单的方法是手动增加i而不是依赖enum

python - NLTK 将标记化的句子转换为同义词集格式

我希望使用NLTK获得单个单词与句子中每个单词之间的相似度。NLTK可以得到两个特定单词之间的相似度,如下所示。此方法需要给出对单词的特定引用,在本例中为“dog.n.01”,其中dog是名词,我们要使用第一个(01)NLTK定义。dog=wordnet.synset('dog.n.01')cat=wordnet.synset('cat.n.01')printdog.path_similarity(cat)>>0.2问题是我需要从句子中的每个单词中获取词性信息。NLTK包能够获取句子中每个单词的词性,如下所示。但是,这些语音部分('NN'、'VB'、'PRP'...)与同义词集作为参数

python - 如何在 Python 中遍历字符串的句子?

假设我有一个字符串text="Acompilertranslatescodefromasourcelanguage"。我想做两件事:我需要使用NLTK库遍历每个单词和词干。词干提取函数是PorterStemmer().stem_word(word)。我们必须传递参数“word”。我怎样才能提取每个单词并取回提取的句子?我需要从text字符串中删除某些停用词。包含停用词的列表存储在文本文件中(空格分隔)stopwordsfile=open('c:/stopwordlist.txt','r+')stopwordslist=stopwordsfile.read()如何从text中删除那些停用