草庐IT

百度文心一言正式亮相

lzhdim 2023-07-18 原文

OpenAI 刚发布了 GPT-4,百度预热已久的人工智能生成式对话产品也终于亮相了。昨天下午,文心一言 (ERNIE Bot)—— 百度全新一代知识增强大语言模型、文心大模型家族的新成员,正式在百度总部 “挥手点江山” 会议室里发布。

发布会一开场,百度 CEO 李彦宏先给大家打了一剂预防针:

从某种意义上说百度为此(发布文心一言)已经准备了多年,我们十几年前就开始投入 AI 研究,2019 年就推出了文心大语言模型,今天的文心一言是过去多年努力的延续。

但也不能说我们完全 ready 了,文心一言要对标 ChatGPT、甚至是对标 GPT-4 的门槛是很高的,全球大厂还没有一个做出来的,百度是第一个。我自己测试感觉还是有很多不完美的地方。

李彦宏指出:“无论是哪家公司,都不可能靠突击几个月就能做出这样的大语言模型。深度学习、自然语言处理,需要多年的坚持和积累,没法速成。”

文心一言,能做什么?

文心一言作为国内几个大厂中诞生出的首个生成式 AI 产品,到底能实现什么样的功能呢?百度 CEO 李彦宏也没有藏着掖着,在发布会一开始就展现了文心一言的 5 个使用场景,并且针对这些使用场景一一进行了功能展示。

  • 文学创作;

  • 商业文案的创作;

  • 数理逻辑的推算;

  • 中文的理解;

  • 多模态生成;

目前用户在体验 ChatGPT 这样的生成式 AI 时会发现一个问题,那就是即便有事实依据,AI 依然会一本正经地胡说八道(例如前段时间 Google Bard 出现的失误),如果用户没有经过验证,轻信了 AI 生成的内容,反而会铸成大错。那么面对这样的问题,文心一言能否轻松应对呢?

场景一:在第一个场景对话中,文心一言准确地提供了《三体》作者、核心内容、电视剧演职人员、甚至是演员本人的共同点与差异信息,在保证事实性问题不出错的情况下,亦展现了在续写内容方面的创作能力。

场景二:针对商业文案创作,现场则是演示三轮对话,涉及了给公司起个名字、写 Slogan,以及写篇新闻稿。从现场的演示来看,文心一言非常了解国人的喜好,以及中文字词中所蕴含的深意。以给科技服务公司取名字这个环节为例,给出的答案完全符合国人对于这类公司取名的畅想,客户通过名称一眼就能知道公司类型甚至是业务方向。

场景三:在数理逻辑推演环节,则是演示了一个家喻户晓的鸡兔同笼问题,但百度为了展示文心一言的能力,偷偷设置了一个 “陷阱”,给出了一个完全无解的题目。不过这并没有难倒文心一言,它立刻发现题目出错,后来经过修改,文心一言准确地回答出问题,并给出了简单的解题思路。

场景四:在发布会期间,百度 CEO 李彦宏也大方承认,目前文心一言虽然也支持英文问答,但实力依然有限。而主打的中文理解,无论是成语「洛阳纸贵」的含义,还是成语背后隐含的经济原理,甚至是对 “藏头诗” 这个词的理解,以及最后生成的诗句,在这一轮则是展现的淋漓尽致。

场景五:多模态生成是前几天 GPT-4 发布时着重增强的一大特性,当时 OpenAI 展示了从草图生成代码的能力。文心一言在这个环节也是 Show 了一把多模态生成,除了之前几个场景中所展示的文字对话能力,在场景五中还展示出了图像、视频和语音(方言)生成方面的能力,目前火热的 ChatGPT 还无法实现后面列举出的这几个功能。

与 Bing Chat 和 ChatGPT 的对比

相比 ChatGPT 和 Bing Chat,“文心一言” 最大的不同点在于多模态生成,即可以通过语言生成海报、语音甚至视频内容。发布会演示中,李彦宏展示了使用文心一言生成活动海报、方言语音,并根据提问内容生成与活动相关的视频。不过生成视频的成本较高,现阶段尚未对所有用户开放。

图片、视频的生成能力确实让我们眼前一亮,李彦宏也表示,多模态生成式 AI 是一个明确的发展趋势。

演示过程中,李彦宏多次强调百度在中文语言的处理上,处于独一无二的位置。

下面的例子展示了用发布会中演示的内容去询问 ChatGPT(3.5 版)以及 Bing Chat 的回答。

首先是关于《三体》的提问,Bing Chat 和文心一言均能正确回答作者是谁、来自哪里的问题,而 ChatGPT 则把刘慈欣的籍贯错标成了山东。

Bing Chat 的回答还显示其信息来源是百度百科。

而在关于 2023 年初上演的《三体》电视剧版演员的问题中,信息库停留在 2021 年的 ChatGPT 再次犯错,表示《三体》电视剧暂未开拍,而 Bing Chat 则在豆瓣中找到了答案。

在商业文案创作方面,三者均可以给出它们的看法,ChatGPT 还贴心地附上了英文名。

而 Bing Chat 则在第一次询问时识别错了问题含义,没有提供准确的公司名,而是提供了如何起一个公司名的解决方案。

虽然在此前的使用中,不论是 ChatGPT 还是 Bing Chat,它们在做数学题时并不能让我们完全放心。不过百度发布会中提到的鸡兔同笼问题并没有难倒二者,均准确地做出了解答。

可以看到,Bing Chat 的解读像是一位循循善诱的老师,而文心一言的回答则有点像课后的参考答案。

来到中文理解方面,文心一言的优势就体现出来了。

在询问「当时洛阳的纸到底有多贵」时,ChatGPT 误以为询问的是唐代的物价,因此返回的信息是洛阳的纸一点都不贵,Bing Chat 识别上没有问题,但也没有给出准确数据。

而文心一言给出两三千文的价格,至少与搜索得到的数据是一致的。

相信你也注意到了,且不说写的内容如何,ChatGPT 和 Bing Chat 都没有理解什么是藏头诗,相比下来,百度文心一言的表现确实出色。

由此可见,文心一言在中文领域的表现确实要优于 ChatGPT、Bing Chat。不过,李彦宏在发布会中也提到,虽然中文方面优势明显,但文心一言针对英文语种、代码场景的训练还不够多,表现也不够好,相信接下来百度会迅速提升。

技术架构 & 特性

百度首席技术官王海峰在发布会上详解了文心一言背后的文心大模型及技术特性。

百度在人工智能四层架构中有全栈布局:包括底层的芯片、深度学习框架、大模型以及最上层的搜索等应用;文心一言则位于模型层。

王海峰表示,文心一言能迅速推出主要是基于百度十一年来的积累,且四层之间形成了层到层的反馈、端到端的优化。尤其是框架层的飞桨和模型层的文心大模型之间的协同优化,在开发文心一言的过程中起到了至关重要的作用。

根据介绍,文心一言是新一代知识增强大语言模型,基于 ERNIE 及 PLATO 系列模型研发;采用了六项核心技术,包括:监督精调、人类反馈的强化学习、提示、知识增强、检索增强和对话增强。前三项是同类大型语言模型普遍具备的能力,ERNIE 和 PLATO 中已经有应用和积累,在一言中又有了进一步强化和打磨;后三项则是百度已有特色技术的再创新。

文心一言大模型的训练数据包括万亿级网页数据、数十亿的搜索数据和图片数据、百亿级的语音日均调用数据,以及 5500 亿事实的知识图谱等。但王海峰也坦言,目前大模型的训练还不够充分。将来随着真实用户的反馈越来越多,文心一言的效果和能力都会逐渐提升。

体验途径

百度已公布文心一言的邀请测试方案。

3 月 16 日起,首批用户即可通过邀请测试码,在文心一言官网体验产品,后续将陆续开放给更多用户

企业客户则可以使用百度智能云开放的「文心一言」 API 接口
(https://cloud.baidu.com/survey_summit/wenxin.html?track=C896034 ),尚未获取 API 的企业可在百度智能云平台进行预约。

有关百度文心一言正式亮相的更多相关文章

  1. IDEA 2023.1 正式发布,新特性简介 - 2

     昨晚看到IDEA官推宣布IntelliJIDEA2023.1正式发布了。简单看了一下,发现这次的新版本包含了许多改进,进一步优化了用户体验,提高了便捷性。至于是否升级最新版本完全是个人意愿,如果觉得新版本没有让自己感兴趣的改进,完全就不用升级,影响不大。软件的版本迭代非常正常,正确看待即可,不持续改进就会慢慢被淘汰!根据官方介绍:IntelliJIDEA2023.1针对新的用户界面进行了大量重构,这些改进都是基于收到的宝贵反馈而实现的。官方还实施了性能增强措施,使得Maven导入更快,并且在打开项目时IDE功能更早地可用。由于后台提交检查,新版本提供了简化的提交流程。IntelliJIDEA

  2. ruby - Ruby 语法中 "#{}"标记的正式术语是什么? - 2

    背景我最近发布了ananswer我在不同的地方将#{}称为文字、运算符和(在一个草案中)“文字构造函数”。这个定义的模糊性并没有真正影响答案的质量,因为问题更多是关于它的作用以及如何找到它的语言引用,但我对无法准确指出规范定义感到不满怎么称呼这个Ruby语法元素。Rubymanual在关于expressionsubstitution的部分中提到了这个语法元素,但并没有真正定义语法本身的术语。几乎所有对该语言元素的引用都说它用于字符串插值,但没有定义它是什么。维基百科定义这里有一些维基百科定义暗示这个结构(严格来说)既不是文字也不是运算符。Literal(computerprogramm

  3. ruby - Ruby 的字符串文字并置功能的正式记录在哪里? - 2

    我最近意识到,如果您并置一系列Ruby字符串文字(例如'a'"b"'c'),则相当于这些字符串文字的串联。但是,我无法在任何地方找到这种语言功能的文档。我使用术语“并置”和“串联”进行了搜索,但只在几个StackOverflow响应中找到了对它的引用。谁能给我指出一个明确的引用? 最佳答案 更新这是nowofficiallydocumented在Ruby附带的RDoc中。更改将传播到RubyDoc下次他们构建文档时。添加的文档:Adjacentstringliteralsareautomaticallyconcatenatedbyt

  4. 云上数据变革:Databend Cloud 正式发布 - 2

    2023年4月20 日,DatabendCloud经历了近两年的打磨终于发布了!🎉此次发布会由北京数变科技有限公司【DatabendLabs】联合阿里云共同举办。DatabendCloud借助于云原生数仓Databend实现了云简单易用的大数据分析场景。以下内容来自Databend联合创始人-王吟、DatabendCloud平台负责人-李亚舟以及阿里云智能资深产品运营专家-蔡亮伟,在本次发布会上的分享总结。🙋本次发布会分为三个部分:第一部分:王吟,李亚舟分享:「 云上数据变革,DatabendCloud发布」第二部分:蔡亮伟分享:「阿里云对象存储OSS, 构建企业级数据湖底座」第三部分:在阿里

  5. ruby - Ruby 是否有正式的规范(如 Java 语言规范 (JLS))? - 2

    Ruby是否有明确的规范,类似于Java的Java语言规范。谷歌搜索ruby​​语言规范提供http://ruby-std.netlab.jp/结果,该站点已关闭,我不确定它是否是最新的 最佳答案 有adraft对于formalspecificationruby。它由OpenStandardsPromotionCenter开发的Information-TechnologyPromotionAgency(日本政府机构)提交给JapaneseIndustrialStandardsCommittee然后进一步到InternationalO

  6. 正式开赛|2023年“桂林银行杯”数据建模大赛暨全国大学生数学建模竞赛广西赛区热身赛 - 2

    为学习贯彻党的二十大工作报告中关于加快发展数字经济、促进数字经济和实体经济深度融合的重要指示,不断推进数字化转型与金融科技创新,桂林银行联合全国大学生数学建模竞赛广西赛区组委会、广西应用数学中心(广西大学)共同主办2023年“桂林银行杯”数据建模大赛暨全国大学生数学建模竞赛广西赛区热身赛。本次大赛旨在向学科专业竞赛靠拢,鼓励大学生向创新型、应用型、复合型人才发展,更好地提升大学生的创新意识和金融科技能力,为数据分析与建模人才提供更广阔的发挥平台,为建设数字中国、数字广西提供新动能。赛道说明:赛道A:个人消费贷款申贷客户识别。此赛道面向本科及以下学历的高校在校生。赛道B:Z世代的信用卡消费行为分

  7. 踏浪而行,逐浪而上| MEME全新版本2.0正式上线 - 2

    踏浪而行,逐浪而上,MEME全新版本2.0乘势而来,荣耀上线,2022年7月27日,全网最难爆仓平台MEME携全新2.0版正式上线!MEME2.0版本探索更多功能,全面升级重新定义合约,体验感更好,交易更流畅,相比于原来的1.0,MEME2.0版本上线后,全面支持独立钱包与邮箱登陆,全网最难爆仓平台!从追赶者到领航者数字资产和区块链的成长过程,如同观察一个生态系统,一个新兴事物从无到有的蓬勃发展,这带给我们的冲击是前所未有的。尽管生态系统已经拥有相当悠久的历史,但数字化技术的出现改变了一切。不同于传统的生态圈,数字生态系统实现了1+1>2的协同效应。MEME全网首家Web3交互交易平台,去中心

  8. win10系统下Edge浏览器搜索引擎[必应]和新建标签页被篡改百度的一种解决方式 - 2

    一、我的情况:win10系统下Edge浏览器搜索引擎[必应]和新建标签页被篡改百度的搜索引擎和百度的页面我的解决方案步骤如下:1.检查电脑管家的浏览器保护检查一下你的电脑是否后台开启了电脑管家;如果是,则检查一下是否开启了浏览器保护。由于我是联想的笔记本,自带联想管家,一直没有关闭过它,以我的电脑为例,进行关闭,如下图所示。其他的电脑管家软件,应该也有类似的功能,耐心找一下就能找到啦。2.在Edge浏览中进行相关设置先点击浏览器右上角的三个点,然后找到“设置”,然后进入设置界面。在当前页面手动搜索“搜索引擎”,然后选择需要的搜索引擎“必应”,然后点击管理搜索引擎。进入管理搜索引擎界面后,理论上

  9. 文心一言发布的个人看法 - 2

    文心一言发布宣传视频按照发布会上说的,文心一言并非属于百度赶工抄袭Chat-GPT的作品,而是十几年一直布局AI产业厚积薄发的成果,百度在芯片,机器学习,自然语言处理,知识图谱等方面均有相对深厚的积累。国内互联网目前真正有核心竞争力的产品并不多。多数处于应用层,导致内卷无限加剧。这个姑且不算为绝对的”创新“,目前文心一言仅仅对中文训练有达到一定的成熟度,英文支持并不友好。开放内测的目的是为了,利用公共资源进一步完善文新一言训练。关于创造力的一些理论富有创造力的人通 常有他们自己的理论,而且彼此间的理论相当不同。罗伯特· 高尔文说 创造力包含预期与奉献:预期是指在其他人认识到之前,便预见到某个事

  10. javascript - Echarts3(百度)工具提示中的彩色圆形 - 2

    Echarts3(baidu)工具提示中的彩色圆形默认情况下,工具提示具有与图形相同颜色的圆形,如下所示:http://echarts.baidu.com/gallery/editor.html?c=candlestick-brush但是,如果我自定义工具提示,它会像本例中那样删除颜色编码的圆形:https://ecomfe.github.io/echarts/doc/example/tooltip.html#-en有没有办法使用自定义工具提示并将颜色放回原处。这是另一种解释方式。转到此链接pie-simple并且您会发现没有彩色圆形的图表。删除以下行:formatter:"{a}{b

随机推荐