One-shot就能做事件抽取？ChatGPT在信息抽取上的强大应用

常鸿宇 2023-07-07 原文

One-shot就能做事件抽取？ChatGPT在信息抽取上的强大应用

0. 前言

近期，OpenAI发布的chat GPT可谓是各种刷屏，很多人都在关注这种模式是否可以应用于搜索引擎，这给做搜索的朋友们带来了很大的危机感。然而，我尝试用它做信息抽取，也得到了让我感到非常害怕的结果。本文就结合一个简单的例子，来聊一聊chat GPT在信息抽取上的使用。

1. 灵感

事情的起因是Blender Lab的一篇论文，《CODE4STRUCT: Code Generation for Few-Shot Structured Prediction from Natural Language》，做的是事件论元抽取（EAE，Event Argument Extraction），我看到这个题目的时候，第一反应就是应该跟UIE的前身Text2Event (Lu et al., 2021)比较相似，果然在大概读了一下这篇论文之后，发现论文对比的工作主要就是这三个：

DEGREE (Hsu et al., 2022)
BART-Gen (Li et al., 2021)
Text2Event (Lu et al., 2021)

其中，后两者我都读过论文，也实验过，第一个DEGREE暂时还没有了解。另外值得一提的是本文的作者也是BART-Gen的作者。

说回这篇论文，目的就是通过一个生成式的模型，实现从非结构化的文本，到“伪结构化”的文本，然后再解码出事件，主要创新点在于，没有直接用template+text组合的范式作为输入文本，而是把输入写到了代码的注释里，借助OpenAI的CODEX (Chen et al., 2021) ，去生成一段代码，其中代码里的内容是事件的论元。

从图中可以看出，code4structure的输入会非常长，包括了schema的定义，给出的例子，以及写在注释里的原文。

整篇论文浏览下来，发现作者似乎并没有提出创新性的模型，只是在任务范式上进行了转换，在模型上完全是调用了Codex的API。在之前的博客《（杂谈）世界上本没什么prompt，有的只是加权平均——关于NLP中embedding的一点思考》中，我们探索了prompt在做什么，其本质是prompt中提供了若干“锚点”，以学习其他token的表征。所以这篇文章做的工作，在我看来是显而易见能够收到这样一个结果的，因为这个模型已经训练的足够强大。

那么说回这个Codex，我之前对它完全没有了解，去查了一下发现也是openAI做出来的，其模型也是采用的GPT-3，训练样本主要是GitHub里的一些开源项目。

那么问题来了，如果Codex可以用来做事件抽取，那chatGPT应该也没有问题吧？

2. 实验

带着这个想法，我从同事那里借来了一个openAI的账号，chat GPT能不能完成任务。

在这里我没有直奔主题，直接输入文本让它抽取，因为之前看到有人介绍这个模型是会考虑之前交互的所有内容的，包括你的问题和它给出的答案，所以最好是一步步的引导它。

于是我先问它知不知道事件抽取相关的概念：

回答的挺不错的，然后进一步引导，因为我马上要给schema了，就先让它解释一下schema：

接下来就是主要部分了，以ACE2005中的事件模式为例。我先告诉它，schema是什么，然后给它一个例子，告诉它，我给你这样一句话，你应该给我输出什么，最后把输入文本告诉它，让它给出相应的输出：

这个模型可以接收的输入挺长的，可以放心给。其实我给的这一场段话，都可以理解为所谓的“prompt”。

这是模型给出的回答，可以看到效果是相当不错的，也就是说，我们完全可以利用chatGPT实现one-shot的事件抽取，这是一件相当可怕的事情，对之前的信息抽取研究简直就是降维打击。

应用在信息抽取中，这个模型可怕的地方，不仅在于one-shot，还有以下两点：

它会保留之前的对话信息；
它会在与用户的交互中轻松实现纠正。

对于第一点，我在介绍清楚了任务范式之后，接下来的抽取，就不再需要每次描述一遍我的schema了：

可以看到，我给一句话的输入，它直接就给我返回输出结果了。

并且，我觉得Place和target论元它抽取的不太对，好像是对我的例子理解的有问题，因为我只给了它一个例子，在那个例子中，所有的角色都能找到相应的论元。所以我又告诉它，如果哪个角色没有论元的话，你给我保留为空就行：

然后它就很聪明的学会了：

接下来，再来一个例子检验一下：

效果已经很不错了，但是这个opened fire，我认为不是instrument，所以我再跟模型强调一下：

到这里，模型所能够输出的效果，已经比我之前有监督训练的模型更好了，让我忍不住自我怀疑，之前到底训练了个什么东西，在大样本预训练模型面前竟然如此不堪一击。

3. 结论

事件抽取作为信息抽取中比较难的任务，已经很轻松的被chat GPT拿下了，我相信不仅是我，很多从业者，包括这两年在三大顶会上发表过很多文章的大佬，或多或少都会有一些自我怀疑。这也给我们提了个醒，仅仅依靠范式迁移做的所谓创新，其实并没有什么实际价值，从应用层面上已经被大预料大模型吊打，而从模型结构的改进而言，似乎也没有什么征兆显示短期内有什么结构可以取代transformer。

并不是说chatGPT已经是一个非常成熟的应用，马上就要颠覆这个颠覆那个，但是不可否认的是，对于信息抽取这样高度结构化的“简单”任务，大模型是很容易handle的。在prompt的范式下，输入的目标文本中的每个token可以与用户的其他描述性的输入发生更多的交互，而在大模型足够多参数加持下，这一优势似乎会被放大很多。

但是从模型给出的结果可以看出，它除了把我想要的答案给出了之外，还给了一些解释，其实这些解释我是不想要的。那么对于应用来讲，可能需要做一些restructure的工作，或许将来某一天，等大模型更成熟一些，这类restructure的工作也可以省略了。

One-shot 做事 xff0c xff0 xff chatgpt 人工智能自然语言处理

有关One-shot就能做事件抽取？ChatGPT在信息抽取上的强大应用的更多相关文章

ruby-on-rails - date_field_tag，如何设置默认日期？ [ rails 上的 ruby ] - 2
我想设置一个默认日期，例如实际日期，我该如何设置？还有如何在组合框中设置默认值顺便问一下，date_field_tag和date_field之间有什么区别？最佳答案试试这个:将默认日期作为第二个参数传递。youcorrectlysetthedefaultvalueofcomboboxasshowninyourquestion. 关于ruby-on-rails-date_field_tag，如何设置默认日期？[rails上的ruby]，我们在StackOverflow上找到一个类似的问
ruby-on-rails - openshift 上的 rails 控制台 - 2
我将我的Rails应用程序部署到OpenShift，它运行良好，但我无法在生产服务器上运行“Rails控制台”。它给了我这个错误。我该如何解决这个问题？我尝试更新rubygems，但它也给出了权限被拒绝的错误，我也无法做到。railsc错误:Warning:You'reusingRubygems1.8.24withSpring.UpgradetoatleastRubygems2.1.0andrun`gempristine--all`forbetterstartupperformance./opt/rh/ruby193/root/usr/share/rubygems/rubygems
ruby-on-rails - 相关表上的范围为 "WHERE ... LIKE" - 2
我正在尝试从Postgresql表(table1)中获取数据，该表由另一个相关表(property)的字段(table2)过滤。在纯SQL中，我会这样编写查询:SELECT*FROMtable1JOINtable2USING(table2_id)WHEREtable2.propertyLIKE'query%'这工作正常:scope:my_scope,->(query){includes(:table2).where("table2.property":query)}但我真正需要的是使用LIKE运算符进行过滤，而不是严格相等。然而，这是行不通的:scope:my_scope,->(que
ruby-on-rails - has_one :through work?如何 - 2
我有三个模型:classReleaseItem:pack_release_itemsendclassPack:pack_release_itemsendclassPackReleaseItem问题是，在执行期间，如果我将一个包添加到release_item，它并不知道该包是一个包。例如:Loadingdevelopmentenvironment(Rails2.1.0)>>item=ReleaseItem.new(:filename=>'MAESTRO.TXT')=>#>>pack=Pack.new(:filename=>'legion01.zip',:year=>1998)=>#>>i
ruby-on-rails - 正确的 Rails 2.1 做事方式 - 2
question的一些答案关于redirect_to让我想到了其他一些问题。基本上，我正在使用Rails2.1编写博客应用程序。我一直在尝试自己完成大部分工作(因为我对Rails有所了解)，但在需要时会引用Internet上的教程和引用资料。我设法让一个简单的博客正常运行，然后我尝试添加评论。靠我自己，我设法让它进入了可以从script/console添加评论的阶段，但我无法让表单正常工作。我遵循的其中一个教程建议在帖子Controller中创建一个“评论”操作，以添加评论。我的问题是:这是“标准”方式吗？我的另一个问题的答案之一似乎暗示应该有一个CommentsController参
ruby - Rails 关联 - 同一个类的多个 has_one 关系 - 2
我的问题的一个例子是体育游戏。一场体育比赛有两支球队，一支主队和一支客队。我的事件记录模型如下:classTeam"Team"has_one:away_team,:class_name=>"Team"end我希望能够通过游戏访问一个团队，例如:Game.find(1).home_team但我收到一个单元化常量错误:Game::team。谁能告诉我我做错了什么？谢谢，最佳答案如果Gamehas_one:team那么Rails假设您的teams表有一个game_id列。不过，您想要的是games表有一个team_id列，在这种情况下
ruby-on-rails - 事件管理员日期过滤器日期格式自定义 - 2
是否有简单的方法来更改默认ISO格式(yyyy-mm-dd)的ActiveAdmin日期过滤器显示格式？最佳答案您可以像这样为日期选择器提供额外的选项，而不是覆盖js:=f.input:my_date,as::datepicker,datepicker_options:{dateFormat:"mm/dd/yy"} 关于ruby-on-rails-事件管理员日期过滤器日期格式自定义，我们在StackOverflow上找到一个类似的问题： https://s
亚特兰蒂斯的回声（中文版): chatGPT 的杰作 - 2
英文版英文链接关注公众号在“亚特兰蒂斯的回声”中踏上一段难忘的冒险之旅，深入未知的海洋深处。足智多谋的考古学家AriaSeaborne偶然发现了一件古代神器，揭示了一张通往失落之城亚特兰蒂斯的隐藏地图。在她神秘的导师内森·兰登教授的指导和勇敢的冒险家亚历克斯·默瑟的帮助下，阿丽亚开始了一段危险的旅程，以揭开这座传说中城市的真相。他们的冒险之旅带领他们穿越险恶的大海、神秘的岛屿和充满陷阱和谜语的致命迷宫。随着Aria潜在的魔法能力的觉醒，她被睿智勇敢的QueenNeria的幻象所指引，她让她为即将到来的挑战做好准备。三人组揭开亚特兰蒂斯令人惊叹的隐藏文明，并了解到邪恶的巫师马拉卡勋爵试图利用其古
ruby-on-rails - 事件记录 : Select max of limit - 2
我正在尝试将以下SQL查询转换为ActiveRecord，它正在融化我的大脑。deletefromtablewhereid有什么想法吗？我想做的是限制表中的行数。所以，我想删除少于最近10个条目的所有内容。编辑:通过结合以下几个答案找到了解决方案。Temperature.where('id这给我留下了最新的10个条目。最佳答案从您的SQL来看，您似乎想要从表中删除前10条记录。我相信到目前为止的大多数答案都会如此。这里有两个额外的选择:基于MurifoX的版本:Table.where(:id=>Table.order(:id).
ruby-on-rails - Ruby - 如何从 ruby 上的 .pfx 文件中提取公钥、rsa 私钥和 CA key - 2
我有一个.pfx格式的证书，我需要使用ruby提取公共(public)、私有(private)和CA证书。使用shell我可以这样做:#ExtractPublicKey(askforpassword)opensslpkcs12-infile.pfx-outfile_public.pem-clcerts-nokeys#ExtractCertificateAuthorityKey(askforpassword)opensslpkcs12-infile.pfx-outfile_ca.pem-cacerts-nokeys#ExtractPrivateKey(askforpassword)o

One-shot就能做事件抽取？ChatGPT在信息抽取上的强大应用