文章目录
随着ChatGPT的大火,提示工程在大模型中的重要性不言而喻,本文参考国外Prompt Engineering Guide完成国内中文版本的《提示工程指南》,希望能够和大家一起交流,分享及发现提示工程的美妙之处。文章所有内容可以在ChatGPT_Prompt_Chinese中找到。
提示工程学是一门相对较新的学科,用于开发和优化提示,以便高效地利用语言模型(LM)来进行各种应用和研究主题。提示工程技能有助于更好地了解大型语言模型(LLM)的能力和限制。研究人员使用提示工程来改善LLM在各种常见和复杂任务上的能力,例如问答和算术推理。开发人员使用提示工程来设计与LLM和其他工具接口的强大和有效的提示技术。
本指南介绍标准提示的基础知识,以提供如何使用提示与指导大型语言模型(LLM)进行交互和指导的大致概念。
除非另有说明,否则所有示例均使用chatgpt进行测试,所以输出内容和国外版本的文档有些出入。Prompt Engineering Guide的测试环境是text-davinci-003(使用OpenAI的playground进行测试)。它使用默认配置,例如temperature=0.7和top-p=1。
您已经可以通过提示实现很多功能,但结果的质量取决于您提供的信息量。提示可以包含信息,例如您传递给模型的指令或问题,以及包括其他细节,例如输入或示例。
以下是一个简单提示的基本示例:
Prompt:
天空是
Output:
天空是什么?
正如您所看到的,语言模型根据 “天空是” 的上下文输出了一个问句。输出可能会出乎意料,或者远离我们想要实现的任务。
这个基本示例也突出了提供更多关于我们具体想要实现什么任务的上下文或说明的必要性。
让我们试着改进一下:
Prompt:
完成句子:
天空是
Output:
天空是一种美丽的自然景观,展现着无限的宽广和深邃。
这样是不是更好了?我们告诉模型完成句子,因此结果看起来好多了,它恰好遵循了我们告诉它要做的(“完成句子”)。这种设计最佳提示以指导模型执行任务的方法被称为提示工程。
以上示例是当前语言模型可能的基本示例。当前的语言模型能够执行各种高级任务,从文本摘要到数学推理再到代码生成等等。
说明:这部分内容主要是针对davinci-003环境,本文演示的chatgpt已经是一个较成熟的产品了,因为不具备超参调节的功能
在使用提示时,您将通过API或直接与LLM进行交互。您可以配置一些参数以获得不同的提示结果。
Temperature- 简而言之,温度越低,结果越确定,即始终选择最可能的下一个标记。增加温度可能会导致更多的随机性,从而鼓励更多多样化或创造性的输出。我们基本上是增加了其他可能标记的权重。在应用方面,我们可能希望在基于事实的问答(QA)中使用较低的温度,以鼓励更多基于事实和简洁的回答。对于诗歌生成或其他创意任务,增加温度可能会有所好处。
Top_p - 同样,通过top_p进行采样,使用称为核采样的温度采样技术,您可以控制模型在生成响应时的确定性。如果您正在寻找准确和真实的答案,请保持较低。如果您希望获得更多样化的响应,请增加到较高的值。
一般建议是只更改其中一个参数而不是两个都更改。
在开始一些基本示例之前,请记住,您的结果可能会因您使用的LLM版本而有所不同。
我们尝试了一个非常简单的提示。标准提示的格式如下:
<Question>?
这可以转换成QA格式,这在许多QA数据集中是标准格式,如下所示:
Q: <Question>?
A:
鉴于上述标准格式,一种流行且有效的提示技术被称为Few-shot提示,其中我们提供示例。Few-shot提示的格式如下:
<Question>?
<Answer>
<Question>?
<Answer>
<Question>?
<Answer>
<Question>?
你已经猜到了,其QA格式的版本如下所示:
Q: ?
A:
Q: ?
A:
Q: ?
A:
Q: ?
A:
请注意,我们在实际场景中并不一定需要使用QA格式。具体的格式取决于手头的任务。例如,您可以执行一个简单的分类任务,并给出演示该任务的实例,如下所示:
Prompt:
这很棒!// 积极
这很糟糕!// 消极
哇,那部电影太棒了!// 积极
多么可怕的节目啊!//
Output:
多么可怕的节目啊!// 消极
Few-shot提示使得在上下文学习中成为可能,即语言模型仅通过少量的示例就可以学习任务。我们将在即将发布的指南中看到更多这方面的内容。
随着我们越来越多地涉及提示工程的例子和应用,您会注意到组成提示的某些要素。
提示可以包含以下任何组成部分:
指令 - 您想让模型执行的具体任务或指令
上下文 - 可以涉及外部信息或附加上下文,可以引导模型做出更好的响应
输入数据 - 是我们有兴趣找到响应的输入或问题
输出指示 - 表示输出的类型或格式。
并非所有组成部分都是提示所必需的,格式取决于手头的任务。我们将在后面发布的指南中涉及更多具体的示例。
以下是在设计提示时应牢记的一些技巧:
当您开始设计提示时,应牢记这是一个迭代的过程,需要大量的试验才能获得最佳结果。使用像OpenAI或Cohere这样的简单实验场所是一个很好的起点。
您可以从简单的提示开始,随着您的目标越来越明确,逐渐添加更多的元素和背景。在这个过程中进行版本控制非常重要。在我们阅读本指南时,您会看到许多例子表明,明确、简洁和精确通常会给您带来更好的结果。
当您有一个涉及许多不同子任务的大型任务时,可以尝试将任务分解为更简单的子任务,并随着您获得更好的结果而逐步构建。这避免了在提示设计过程中添加过多的复杂性。
通过使用指令来指导模型进行各种简单任务的设计,例如“写入”、“分类”、“总结”、“翻译”、“排序”等。
请记住,您还需要进行大量的实验,以查看哪种方法最有效。尝试使用不同的指令、关键字、上下文和数据,看看什么对您的特定用例和任务最有效。通常,上下文对于您尝试执行的任务越具体和相关,效果越好。我们将在即将推出的指南中介绍采样和添加更多上下文的重要性。
其他人建议将指令放在提示的开头。建议使用一些清晰的分隔符,如“###”,来分隔指令和上下文。
例如:
Prompt:
###指令###
将下面的文本翻译成西班牙语:
文本:“嗨!”
Output:
Texto: “¡Hola!”
在指示和任务上要非常具体。提示越详细,结果就越好。当您需要特定的输出或生成风格时,这一点尤其重要。并不存在能够导致更好结果的特定标记或关键字。拥有良好的格式和描述性的提示更加重要。实际上,在提示中提供示例非常有效,这样可以获得特定格式的所需输出。
设计提示时,您还应牢记提示的长度,因为长度存在一定的限制。需要考虑具体和详细的程度。并不是无用细节越多越好,而是应当与任务有关并有助于完成任务的相关细节越多越好。这是需要进行大量实验和迭代以优化应用程序的提示的一个方面。
例如,让我们尝试从一段文本中提取特定信息的简单提示。
Prompt:
提取以下文本中的地名。
期望格式:
地点: <comma_separated_list_of_company_names>
输入:“尽管这些发展令研究人员感到鼓舞,但仍有很多谜团。“我们经常在大脑和我们在外围看到的效果之间有一个黑匣子,”里斯本尚帕利莫未知中心的神经免疫学家恩里克·维加-费尔南德斯说。“如果我们想在治疗环境中使用它,我们实际上需要了解其机制。”
Output:
地点: 里斯本尚帕利莫未知中心
输入文本取自Nature文章。
根据上述关于详细说明和改善格式的提示,很容易陷入想要变得过于聪明的陷阱,从而可能创建不精确的描述,因此直接和具体的描述往往更好。这里的类比与有效沟通非常相似–越直接,信息就越能有效传达。
例如,您可能有兴趣了解提示工程的概念。您可以尝试像这样的东西:
解释提示工程的概念。保持解释简短,只有几句话,不要过于描述。
从上面的提示中无法清楚地了解使用多少句话以及采用什么样的风格。您可能仍然可以获得良好的响应,但更好的提示是非常具体,简明扼要和直截了当的。例如:
用2-3个句子向高中生解释提示工程的概念。
设计提示的另一个常见技巧是避免说明不要做什么,而是说明要做什么。这鼓励更具体化和更专注于细节,从而获得模型的良好响应。
以下是电影推荐聊天机器人的示例,因为我的指令的表述方式而未能成功做到我不想做的事情 - 焦点在于避免做什么。
Prompt:
以下是向客户推荐电影的代理。不要询问兴趣。不要询问个人信息。
客户:请根据我的兴趣推荐电影。
代理:
Output:
代理:
非常感谢您的请求。以下是我们为您推荐的一些电影:
- 头号玩家 (Ready Player One)
- 盗梦空间 (Inception)
- 阿凡达 (Avatar)
- 星际穿越 (Interstellar)
- 风云雄霸天下 (The Godfather)
- 我们希望您会喜欢其中的某一部电影。
可能ChatGPT相比于davinci-3做了些优化,使得回答更加准确了。。。。
这是一个更好的提示:
Prompt:
以下是向客户推荐电影的代理。代理负责从全球流行电影中推荐电影。
它应该避免询问用户的偏好并避免询问个人信息。如果代理没有电影推
荐,它应该回答“很抱歉,今天找不到电影推荐。”
客户:请根据我的兴趣推荐电影。
代理:
Output:
很抱歉,我没有关于您的兴趣的信息。然而,这是目前全球流行电影列表:[电影列表]。希望您能找到自己喜欢的电影!
上面的一些示例摘自“使用OpenAI API进行提示工程的最佳实践”文章。
本文主要介绍了提示工程的一些基本示例,下一章会介绍一些基本的提示。
如何在buildr项目中使用Ruby?我在很多不同的项目中使用过Ruby、JRuby、Java和Clojure。我目前正在使用我的标准Ruby开发一个模拟应用程序,我想尝试使用Clojure后端(我确实喜欢功能代码)以及JRubygui和测试套件。我还可以看到在未来的不同项目中使用Scala作为后端。我想我要为我的项目尝试一下buildr(http://buildr.apache.org/),但我注意到buildr似乎没有设置为在项目中使用JRuby代码本身!这看起来有点傻,因为该工具旨在统一通用的JVM语言并且是在ruby中构建的。除了将输出的jar包含在一个独特的、仅限ruby
在rails源中:https://github.com/rails/rails/blob/master/activesupport/lib/active_support/lazy_load_hooks.rb可以看到以下内容@load_hooks=Hash.new{|h,k|h[k]=[]}在IRB中,它只是初始化一个空哈希。和做有什么区别@load_hooks=Hash.new 最佳答案 查看rubydocumentationforHashnew→new_hashclicktotogglesourcenew(obj)→new_has
我的主要目标是能够完全理解我正在使用的库/gem。我尝试在Github上从头到尾阅读源代码,但这真的很难。我认为更有趣、更温和的踏脚石就是在使用时阅读每个库/gem方法的源代码。例如,我想知道RubyonRails中的redirect_to方法是如何工作的:如何查找redirect_to方法的源代码?我知道在pry中我可以执行类似show-methodmethod的操作,但我如何才能对Rails框架中的方法执行此操作?您对我如何更好地理解Gem及其API有什么建议吗?仅仅阅读源代码似乎真的很难,尤其是对于框架。谢谢! 最佳答案 Ru
我的假设是moduleAmoduleBendend和moduleA::Bend是一样的。我能够从thisblog找到解决方案,thisSOthread和andthisSOthread.为什么以及什么时候应该更喜欢紧凑语法A::B而不是另一个,因为它显然有一个缺点?我有一种直觉,它可能与性能有关,因为在更多命名空间中查找常量需要更多计算。但是我无法通过对普通类进行基准测试来验证这一点。 最佳答案 这两种写作方法经常被混淆。首先要说的是,据我所知,没有可衡量的性能差异。(在下面的书面示例中不断查找)最明显的区别,可能也是最著名的,是你的
几个月前,我读了一篇关于rubygem的博客文章,它可以通过阅读代码本身来确定编程语言。对于我的生活,我不记得博客或gem的名称。谷歌搜索“ruby编程语言猜测”及其变体也无济于事。有人碰巧知道相关gem的名称吗? 最佳答案 是这个吗:http://github.com/chrislo/sourceclassifier/tree/master 关于ruby-寻找通过阅读代码确定编程语言的rubygem?,我们在StackOverflow上找到一个类似的问题:
我目前正在使用以下方法获取页面的源代码:Net::HTTP.get(URI.parse(page.url))我还想获取HTTP状态,而无需发出第二个请求。有没有办法用另一种方法做到这一点?我一直在查看文档,但似乎找不到我要找的东西。 最佳答案 在我看来,除非您需要一些真正的低级访问或控制,否则最好使用Ruby的内置Open::URI模块:require'open-uri'io=open('http://www.example.org/')#=>#body=io.read[0,50]#=>"["200","OK"]io.base_ur
前言作为一名程序员,自己的本质工作就是做程序开发,那么程序开发的时候最直接的体现就是代码,检验一个程序员技术水平的一个核心环节就是开发时候的代码能力。众所周知,程序开发的水平提升是一个循序渐进的过程,每一位程序员都是从“菜鸟”变成“大神”的,所以程序员在程序开发过程中的代码能力也是根据平时开发中的业务实践来积累和提升的。提高代码能力核心要素程序员要想提高自身代码能力,尤其是新晋程序员的代码能力有很大的提升空间的时候,需要针对性的去提高自己的代码能力。提高代码能力其实有几个比较关键的点,只要把握住这些方面,就能很好的、快速的提高自己的一部分代码能力。1、多去阅读开源项目,如有机会可以亲自参与开源
英文版英文链接关注公众号在“亚特兰蒂斯的回声”中踏上一段难忘的冒险之旅,深入未知的海洋深处。足智多谋的考古学家AriaSeaborne偶然发现了一件古代神器,揭示了一张通往失落之城亚特兰蒂斯的隐藏地图。在她神秘的导师内森·兰登教授的指导和勇敢的冒险家亚历克斯·默瑟的帮助下,阿丽亚开始了一段危险的旅程,以揭开这座传说中城市的真相。他们的冒险之旅带领他们穿越险恶的大海、神秘的岛屿和充满陷阱和谜语的致命迷宫。随着Aria潜在的魔法能力的觉醒,她被睿智勇敢的QueenNeria的幻象所指引,她让她为即将到来的挑战做好准备。三人组揭开亚特兰蒂斯令人惊叹的隐藏文明,并了解到邪恶的巫师马拉卡勋爵试图利用其古
?博客主页:https://xiaoy.blog.csdn.net?本文由呆呆敲代码的小Y原创,首发于CSDN??学习专栏推荐:Unity系统学习专栏?游戏制作专栏推荐:游戏制作?Unity实战100例专栏推荐:Unity实战100例教程?欢迎点赞?收藏⭐留言?如有错误敬请指正!?未来很长,值得我们全力奔赴更美好的生活✨------------------❤️分割线❤️-------------------------
嗨~大家好,这里是可莉!今天给大家带来的是7个C语言的经典基础代码~那一起往下看下去把【程序一】打印100到200之间的素数#includeintmain(){ inti; for(i=100;i 【程序二】输出乘法口诀表#includeintmain(){inti;for(i=1;i 【程序三】判断1000年---2000年之间的闰年#includeintmain(){intyear;for(year=1000;year 【程序四】给定两个整形变量的值,将两个值的内容进行交换。这里提供两种方法来进行交换,第一种为创建临时变量来进行交换,第二种是不创建临时变量而直接进行交换。1.创建临时变量来