草庐IT

Helsinki-NLP

全部标签

从 ChatGPT 爆火回溯 NLP 技术

ChatGPT火遍了全网,多个话题频频登上热搜。见证了自然语言处理(NLP)技术的重大突破,体验到通用技术的无限魅力。GPT模型是一种NLP模型,使用多层变换器(Transformer)来预测下一个单词的概率分布,通过训练在大型文本语料库上学习到的语言模式来生成自然语言文本。而NLP技术是人工智能领域的重要研究分支,被视为人工智能皇冠上的明珠。图灵测试的假设就是针对自然语言处理技术而设计的。本质上说,自然语言处理技术就是为了让计算机理解人类语言。NLP技术其实由来已久从1940年代WarrenWeaver提出机器翻译的思想以来,NLP经历了70多年的发展,从技术的角度大致可分为三个阶段:NLP

java - 在 R 中使用 Stanford NLP 库,使用 rJava 包

有没有人有在R中使用StanfordCoreNLP(http://nlp.stanford.edu/software/corenlp.shtml通过rJava的经验?我已经努力让它工作两天了,并且我想我已经用尽了Google和之前关于StackOverflow的问题。本质上,我正在尝试在R中使用StanfordNLP库。我的Java经验为零,但对其他语言有经验,因此了解有关类和对象等的基础知识。据我所知,库附带的演示.java文件似乎表明,要使用Java中的类,您需要导入库,然后创建一个新对象,如下所示:importjava.io.*;importjava.util.*;importe

java - 借助 NLP 分析句子并提取人名、组织和位置

我需要使用NLP解决以下问题,你能给我一些关于如何使用OpenNLPAPI实现这个的指示吗一个。如何判断一个句子是否暗示过去、现在或将来的某个Action。(e.g.)Iwasverysadlastweek-pastIfeellikehittingmyneighbor-presentIamplanningtogotoNewYorknextweek-future如何找到一个人或公司或国家对应的词(e.g.)JohnisplanningtospecializeinElectricalEngineeringinUCBerkleyandpursueacareerwithIBM).人=约翰公司=

java - 使用 Stanford NLP : Filter unrequired words and characters 进行文本标记化

我使用StanfordNLP在我的分类工具中进行字符串标记化。我只想得到有意义的词,但我得到的是非词标记(如---、>、.等)而不是重要的词,如am、is、to(停用词)。有人知道解决这个问题的方法吗? 最佳答案 在stanfordCorenlp中,有一个stopwordremovalannotator它提供了删除标准停用词的功能。您还可以根据需要在此处定义自定义停用词(即---、可以看例子here:Propertiesprops=newProperties();props.put("annotators","tokenize,ss

java - 在 JAVA 中使用哪个 NLP 工具包?

按照目前的情况,这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持,但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开,visitthehelpcenter指导。关闭10年前。我正在从事一个项目,该项目包含一个连接到NCBI(国家生物技术信息中心)并在那里搜索文章的网站。问题是我必须对所有结果进行一些文本挖掘。我使用JAVA语言进行文本挖掘,使用AJAX和ICEFACES开发网站。我有什么:从搜索返回的文章列表。每篇文章都有一个ID和一个摘要。这个想法是从每个抽象文本中获取关键字。然后比较所有摘要中的所有关键字,找出重复次数最

时间序列预测+NLP大模型新作:为时序预测自动生成隐式Prompt

今天给大家介绍一篇最新的大模型+时间序列预测工作,由康涅狄格大学发表,提出了一种将时间序列在隐空间和NLP大模型对齐,并利用隐空间prompt提升时间序列预测效果的方法。论文标题:S2IP-LLM:SemanticSpaceInformedPromptLearningwithLLMforTimeSeriesForecasting下载地址:https://arxiv.org/pdf/2403.05798v1.pdf1、问题背景大模型在时间序列上的应用越来越多,主要分为两类:第一类使用各类时间序列数据训练一个时间序列领域自己的大模型;第二类直接使用NLP领域训练好的文本大模型应用到时间序列中。由于

今日Arxiv最热NLP大模型论文:Llama-2上下文扩大48倍的方法来了,港大发布,无需训练

引言:大语言模型的长上下文理解能力在当今的人工智能领域,大语言模型(LargeLanguageModels,简称LLMs)的长上下文理解能力成为了一个重要的研究方向。这种能力对于模型来说至关重要,因为它使得LLMs能够有效地应对各种应用场景,例如在庞大的PDF文件中分析和回应查询、保留扩展的对话历史以及增强交互式聊天机器人的功能。然而,由于训练语料库的可获取性有限,以及长上下文微调的成本过高,目前的开源模型在性能上往往无法与专有模型相媲美,且通常只能提供较小的模型尺寸(例如7B/13B)。针对这些限制,不需要额外训练即可进行上下文扩展的方法变得尤为吸引人。最近的无训练方法,包括LM-infin

java - 子句的 QA 生成 - NLP

我的数据集结构如下:产品1-句子1产品2-句子2产品3-句子3..等等句子看起来像这样:Product1-“我们建议您将这件时尚单品搭配金色吊坠耳环、丘里达紧身裤和平底鞋,打造低调的造型。”一个可能的问题是——“我们是否建议您将这件时尚单品与金色吊坠耳环、churidar紧身裤和平底鞋搭配起来,以打造低调的造型?”-这就是我使用的http://www.cs.cmu.edu/~ark/mheilman/questions/但是,我想要这样的问题/答案:问:如何打造低调的造型?A:您可以尝试Product1以获得低调的外观。问:金色吊坠耳环可以戴什么?答:Product1可以搭配金色吊坠耳

清华NLP组发布InfLLM:无需额外训练,「1024K超长上下文」100%召回!

大模型只能够记忆与理解有限的上下文已经成为大模型在真实应用中的能力瓶颈,例如对话式AI系统往往无法记忆你前一天对话的内容,利用大模型构建智能体会产生前后不一致的行为与记忆。为了让大模型能够记忆并处理更长的上下文,来自清华大学、麻省理工学院和人民大学的研究人员联合提出无需额外训练的大模型长文本理解方法InfLLM,利用少量计算和显存开销实现了LLM的超长文本处理。论文地址:https://arxiv.org/abs/2402.04617代码仓库:https://github.com/thunlp/InfLLM实验结果表明,InfLLM能够有效地扩展Mistral、LLaMA的上下文处理窗口,并在

java - 使用 NLP 进行句子检测

我正在尝试从大量文本中解析出句子。使用java我开始使用NLP工具,例如OpenNLP和Stanford的Parser。但这就是我卡住的地方。尽管这两个解析器都非常棒,但是当涉及到非统一文本时它们会失败。例如,在我的文本中,大多数句子都是用句号分隔的,但在某些情况下,例如要点,它们不是。这里两个解析都失败了。我什至尝试在stanford解析中设置多个句子终止符的选项,但输出并没有好多少!有什么想法吗??编辑:为了使它更简单,我希望解析分隔符是新行(“\n”)或句点(“。”)的文本...... 最佳答案 首先,您必须明确定义任务。确切