草庐IT

java - Java 中的意大利语词干提取库

我正在搜索Java库或其他东西来提取意大利语单词字符串。目标是比较意大利语单词。在这一刻,像“attacco”、“attacchi”、“attaccare”等词被认为是不同的,相反我想返回一个真实的比较。我找到了类似Lucene、snowball.tartarus.org等的东西。还有其他有用的东西吗?或者我如何在Java中使用它们?感谢您的回答。 最佳答案 下载Snowball对于Javahere.它包含一个名为org.tartarus.snowball.ext.italianStemmer的类,它扩展了SnowballStemm

java - 使用 NLP 进行句子检测

我正在尝试从大量文本中解析出句子。使用java我开始使用NLP工具,例如OpenNLP和Stanford的Parser。但这就是我卡住的地方。尽管这两个解析器都非常棒,但是当涉及到非统一文本时它们会失败。例如,在我的文本中,大多数句子都是用句号分隔的,但在某些情况下,例如要点,它们不是。这里两个解析都失败了。我什至尝试在stanford解析中设置多个句子终止符的选项,但输出并没有好多少!有什么想法吗??编辑:为了使它更简单,我希望解析分隔符是新行(“\n”)或句点(“。”)的文本...... 最佳答案 首先,您必须明确定义任务。确切

java - Java 中的拼写检查和/或拼写更正

这个问题在这里已经有了答案:LookingforJavaspellcheckerlibrary[closed](8个答案)关闭7年前。如何在Java应用程序中进行拼写检查和/或拼写更正?

【AI视野·今日NLP 自然语言处理论文速览 第八十一期】Mon, 4 Mar 2024

AI视野·今日CS.NLP自然语言处理论文速览Mon,4Mar2024Totally48papers👉上期速览✈更多精彩请移步主页DailyComputationandLanguagePapersMitigatingReversalCurseviaSemantic-awarePermutationTrainingAuthorsQingyanGuo,RuiWang,JunliangGuo,XuTan,JiangBian,YujiuYang虽然大型语言模型法学硕士在不同的任务中取得了令人印象深刻的表现,但最近的研究表明,因果法学硕士遭受了逆转诅咒。这是一个典型的例子,模型知道A的父亲是B,但无法推

java - 从给定文本中提取英语动词

关闭。这个问题是off-topic.它目前不接受答案。想改进这个问题吗?Updatethequestion所以它是on-topic用于堆栈溢出。关闭10年前。Improvethisquestion我需要从给定的文本中提取所有英语动词,我想知道我该怎么做...乍一看,我的想法是使用正则表达式,因为所有英语动词时态都遵循模式,但也许还有另一种方法可以做到这一点。我的想法很简单:为每个动词时态创建一个模式。我必须以某种方式区分规则动词(http://en.wikipedia.org/wiki/English_verbs)和不规则动词(http://www.chompchomp.com/rul

java - 确认实体的最佳方法

我想了解解决以下问题的最佳方法。我有与简历/简历非常相似的文档,并且我必须提取实体(名称,姓氏,生日,城市,邮政编码等)。要提取这些实体,我要组合不同的查找器(正则表达式,字典等)这些查找器没有问题,但是,我正在寻找一种方法/算法或类似的方法来确认实体。“确认”是指我必须在邻近位置(更接近我找到的实体)中找到特定的术语(或实体)。例子:MynameisName:NameandSurname:我可以确认实体,因为它与让我理解“上下文”的特定术语更为接近。如果我在实体附近有“名字”或“姓”字,那么我可以说我很有可能找到了。因此,目标是编写此类规则以确认实体。另一个示例应该是:Myaddre

java - 使用 Stanford CoreNLP 解析共指 - 无法加载解析器模型

我想做一个非常简单的工作:给定一个包含代词的字符串,我想解析它们。例如,我想把“Maryhasalittlelamb.Sheiscute.”这句话转过来。在“Maryhasalittlelamb.Maryiscute.”中。我尝试过使用StanfordCoreNLP。但是,我似乎无法启动解析器。我已经使用Eclipse将所有包含的jar导入到我的项目中,并且我已经为JVM(-Xmx3g)分配了3GB。错误很尴尬:Exceptioninthread"main"java.lang.NoSuchMethodError:edu.stanford.nlp.parser.lexparser.Lex

java - 构建修复拼写错误的自然语言模型

关于如何构建这样的自然语言解析程序的书籍有哪些:input:IgottoTALLyououtput:IgottoTELLyouinput:BigRATboxoutput:BigREDboxin:hoounthumzendthreeout:onethousandthree它必须有语言模型来预测哪些单词拼错了!关于如何构建此类工具的最佳书籍是什么?附注是否有免费的网络服务来进行拼写检查?也许来自谷歌?.. 最佳答案 PeterNorvig写了一篇很棒的文章spellchecker.也许这可以帮助你。

java - 我如何在 OpenNLP 中训练命名实体识别器标识符?

好的,我有以下代码来训练来自OpenNLP的NER标识符FileReaderfileReader=newFileReader("train.txt");ObjectStreamfileStream=newPlainTextByLineStream(fileReader);ObjectStreamsampleStream=newNameSampleDataStream(fileStream);TokenNameFinderModelmodel=NameFinderME.train("pt-br","train",sampleStream,Collections.emptyMap());n

java - 如何将 "WordNet Domains"集成到 WordNet 数据库中?

我正在使用WordNet2.1工具并通过JAWSpro-grammatically访问它(Java用于WordNet搜索的API)。今天我遇到了一个名为WordNet域的新事物,它为WordNet中的每个单词分配了DOMAIN标签。链接:-http://wndomains.fbk.eu/labels.html我已经从上面的链接下载了相同的内容。它是一个zip文件。我的问题是:-如何在Java中将“WordNet域”与“WordNet”一起使用? 最佳答案 由于您使用的是java,因此可以将标签加载为HashMap>.根据个人经验,我