草庐IT

文心一言正式开启内邀!李彦宏:体验并不完美!

徐杰承 2023-03-28 原文

​作者 | 徐杰承

审校 | 云昭

GPT4的提前发布,把压力着实给到百度了!在ChatGPT引爆聊天机器人领域后的数月,我们终于迎来了国内的第一款生成式对话产品。

3月16日14:00,百度文心一言新闻发布会于百度北京总部正式召开。百度创始人、董事长兼CEO李彦宏也实现了自己此前的诺言,将酷技术真正变成了一款人人都需要的产品。

据悉,文心一言(英文名:ERNIE Bot)是百度基于文心大模型技术推出的一款生成式对话产品,可实现自然流畅的人机交互。作为百度的核心技术之一,文心大模型ERNIE具备着跨模态、跨语言的深度语义理解与生成能力。而基于ERNIE技术的文心一言,成功将人工智能技术与人类语言交流能力进行了融合,能够为用户提供优质、智能化的交互体验。

1、Robin展示文心一言续写三体、做洛阳纸贵诗、算鸡兔同笼

目前,大型语言模型和生成式AI代表了一个新的技术范式,是全球每家企业都不可错过的机会。百度文心一言定位于人工智能基座模型的赋能平台,将助力金融、能源、媒体、政务等千行百业的智能化变革。

新闻发布会现场,李彦宏展示了文心一言的五大核心能力以及其在五个使用场景的表现,其中包括文学创作、商业文案创作、数理推算、中文理解和多模态生成。

在文学创作场景中,文心一言根据对话问答将知名科幻小说《三体》的核心内容进行了总结,并提出了多个续写《三体》的建议和思路。此外,文心一言还根据问题内容准确回答了《三体》作者、《三体》电视剧角色扮演者等事实性信息。

目前生成式AI的主要弊端就是对问题回答的准确性难以保障,而文心一言延续了百度知识增强的大模型理念,大幅提高了事实性问题的准确率。面对“于和伟和张鲁一有哪些共同点”、“于和伟和张鲁一谁更高”这类问题,文心一言也依靠信息检索能力及推理能力得出了正确答案。

在商业文案创作场景中,文心一言则顺利完成了为公司命名、撰写公司Slogan、撰写公司成立新闻稿等创作任务。在连续三次内容创作中,文心一言不仅准确理解了用户意图,还完成了对用户反馈的清晰表达。

这是基于庞大数据规模而发生的“智能涌现”。据介绍,文心一言大模型的训练数据包括万亿级网页数据、数十亿搜索数据及图片数据、百亿级语音日均调用数据,以及5500亿事实的知识图谱等,这使得其在中文语言的理解和处理上,能够优于目前世界范围内几乎所有的其他大模型。

数理推算方面,文心一言则依靠其思维能力、数学推演能力及逻辑推理能力成功完成了对“鸡兔同笼”这类锻炼人类逻辑思维的经典例题的解答。

在这一环节中,文心一言不仅识别出了题目中所存在的问题,还成功像人类一样找到了解题思路,并按照正确步骤一步步推演出了题目的准确答案。

如果说文学创作、商业文案创作、数理推算是大语言模型常见的优势和能力。那么文心一言的独特之处,则是更优秀的中文理解及多模态生成能力。

作为扎根于中国市场的大语言模型,文心一言具备中文领域最先进的自然语言处理能力,在中文语言和中国文化上有更好的表现。在第四轮演示中,文心一言正确解释了成语“洛阳纸贵”的含义,并结合成语内涵分析出了“洛阳纸贵”对应的经济学理论,甚至还成功用“洛阳纸贵”四个字创作了一首藏头诗。

而在多模态生成方面,李彦宏现场展示了文心一言生成文本、图片、音频和视频的能力。有趣的是,文心一言甚至能够生成四川话等方言语音;文心一言的视频生成能力则因成本较高,现阶段还未对所有用户开放,未来会逐步接入。

2、文心一言技术解读

文心一言作为新一代知识增强大语言模型,是在ERNIE及PLATO系列模型的基础上研发的。它的关键技术包括有监督精调、人类反馈的强化学习、提示、知识增强、检索增强和对话增强。

前三项是此类大语言模型都会采用的技术,ERNIE和PLATO中也已经有应用和积累,在文心一言中又有了进一步强化和打磨;后三项则是百度已有技术优势的再创新,也是文心一言未来越来越强大的基础。

文心一言的知识增强主要通过知识内化和知识外用两种方式。知识内化,是从大规模知识和无标注数据中,基于语义单元学习,利用知识构造训练数据,将知识学习到模型参数中。知识外用则是引入外部多源异构知识,进行知识推理、提示构建等等。

文心一言的检索增强,来自以语义理解与语义匹配为核心技术的新一代搜索架构。通过引入搜索结果,能够为大模型提供时效性强、准确率高的参考信息,更好地满足用户需求。

[[524500]]

而文心一言的对话增强,则是基于对话技术和应用积累,文心一言具备记忆机制、上下文理解和对话规划能力,实现更好的对话连贯性、合理性和逻辑性。

3、生成式AI催生的三大产业机会

李彦宏提到,如今的AI技术已经发展到一个临界点,各行各业都不可避免地被改变。中国AI市场即将迎来爆发性的需求增长,其商业价值的释放将是前所未有的、指数级的。

自2月份百度官宣“文心一言”以来,已有超过650家企业宣布接入文心一言生态。这意味着很多企业已经理解到,文心一言和生成式AI代表了一个新的技术范式,它会影响到每一家公司。据李彦宏预测,大语言模型将会带来三大产业机会。

第一类便是新型云计算公司,其主流商业模式将从IaaS转变为MaaS。文心一言将根本性改变云计算行业的游戏规则。之前企业选择云厂商更多看算力、存储等基础云服务。未来,则会更注重框架好不好、模型好不好,以及模型、框架、芯片、应用这四层之间的协同。

第二类是进行行业模型精调的公司,这是通用大模型和企业之间的中间层,他们可以基于对行业的洞察,调用通用大模型能力,为行业客户提供解决方案。这方面,百度文心大模型已经在电力、金融、媒体等领域,发布了10多个行业大模型。

第三类则是基于大模型底座进行应用开发的公司,即应用服务提供商。李彦宏断言,对于大部分创业者和企业来说,真正的机会并不是从头开始做ChatGPT和文心一言这样的基础大模型,这很不现实,也不经济。基于通用大语言模型抢先开发重要的应用服务,这可能才是真正的机会。目前,基于文本生成、图像生成、音频生成、视频生成、数字人、3D等场景,已经涌现出很多创业明星公司,可能就是未来的新巨头。

文心一言将通过百度智能云对外提供服务,帮助企业构建自己的模型和应用,农业、工业、金融、教育、医疗、交通、能源等重点领域,都会因此效率大幅提升,并在每一个行业快速形成新的产业空间,助力数字中国的实现。李彦宏预告称,百度智能云将于近期举办新闻发布会,主题围绕文心一言的云服务和应用产品,既有公有云服务和也可以做私有化部署。

在发布会末尾,王海峰表示文心一言目前已开放内测。即日起首批用户可以通过邀请测试码在官网体验文心一言产品,百度智能云即将面向企业客户开放文心一言 API 接口调用服务,在官网可申请加入文心一言云服务测试。

4、文心一言,并不完美

Robin 也坦言此次的发布时,文心一言,并没有完全的Ready。

最近一段时间,很多朋友问我,“为什么是今天,你们真的ready了吗”。其实从某种意义上说我们已经为此准备了多年,我们十几年前就开始投入AI研究2019年就推出了文心大语言模型,今天的文心一言是过去多年努力的延续。但也不能说我们完全ready了,文心一言对标ChatGPT、甚至是对标GPT-4,门槛是很高的,全球大厂还没有一个做出来的,百度是第一个。我自己测试感觉还是有很多不完美的地方。个体选择。  

5、写在最后

看完这场发布会,相信每个人都有自己不同的感触。归根结底,对用户而言,尤其是在文化内容领域,我们还是更需要国内科技企业实打实地使用海量中文语料训练出一些更加匹配中文环境的本土化高品质大模型。

如今,作为国内AIGC的先行者,百度已在这一领域迈出了第一步。未来百度能否在这条道路上越走越远;是否会有更多优秀的国内科技企业踏足这片土壤;中国的AIGC生态又会在这些先行者的厚积薄发之下,产生哪些变化?让我们拭目以待。​

有关文心一言正式开启内邀!李彦宏:体验并不完美!的更多相关文章

  1. 西安华为OD面试体验 - 2

    西安华为OD面试体验开始投简历技术面试进展工作进展开始投简历去年一整年一直在考研和工作之间纠结,感觉自己的状态好像当时的疫情一样差劲。之前刚毕业的时候投了个大厂的简历,结果一面写算法的时候太拉跨了,虽然知道时dfs但是代码熟练度不够,放在平时给足时间自己可以调试通过,但是熟练度不够那面试当时就写不出来被刷了。说真的算法学到后期我感觉最重要的是熟练度和背板子(对于我这种普通玩家来说),面试题如果一上来短时间内想不出思路就完蛋了。然后由于当时找的工作不是很理想就又想考研了。但是考研是有风险的,我自我感觉自己可能冲不上那个学校,而找工作一个没成可以继续找嘛。本着抱着试试看的态度在boss上投了简历,

  2. IDEA 2023.1 正式发布,新特性简介 - 2

     昨晚看到IDEA官推宣布IntelliJIDEA2023.1正式发布了。简单看了一下,发现这次的新版本包含了许多改进,进一步优化了用户体验,提高了便捷性。至于是否升级最新版本完全是个人意愿,如果觉得新版本没有让自己感兴趣的改进,完全就不用升级,影响不大。软件的版本迭代非常正常,正确看待即可,不持续改进就会慢慢被淘汰!根据官方介绍:IntelliJIDEA2023.1针对新的用户界面进行了大量重构,这些改进都是基于收到的宝贵反馈而实现的。官方还实施了性能增强措施,使得Maven导入更快,并且在打开项目时IDE功能更早地可用。由于后台提交检查,新版本提供了简化的提交流程。IntelliJIDEA

  3. 联通家庭宽带开启ipv6 - 2

    联通家庭宽带开启ipv6废话不多,直接开干首先登录联通光猫的后台,机身有写我的是http://192.168.1.1/CU.html广州家庭宽带账号密码CUAdmincuadmin00259e这里好像是默认设置,不大记得了。保存就好然后登陆路由器后台,我的是tp-link选桥模式这里的桥模式跟光猫的wan类型应该是互斥关系,光猫设置桥接,路由器就要设pppoe拨号,我没试过。然后在系统就可以查看了或者直接访问这个网址http://testipv6.com/注意1:如果你是便宜小米红米之类的路由器,他好像是默认不打开这个ipv6防火墙的,也就是你可能在系统上看到有ipv6地址,但实际上是不互通的

  4. 「想体验ChatGPT中文聊天?」那快进来,你用不上算我输 - 2

    ♥️作者:白日参商🤵‍♂️个人主页:白日参商主页♥️坚持分析平时学习到的项目以及学习到的软件开发知识,和大家一起努力呀!!!🎈🎈加油!加油!加油!加油🎈欢迎评论💬点赞👍🏻收藏📂加关注+!「想体验ChatGPT中文聊天?」那快进来,你用不上算我输项目场景:项目条件一、那就开始吧1、安装ChatGPT-Desktop2、OpenAPI设置二、使用实例恭喜你!!!配置成功了!!!API和URL都是博主免费提供给大家的!!!恭喜你!!!配置成功了!!!API和URL都是博主免费提供给大家的!!!🎈🎈加油!加油!加油!加油🎈欢迎评论💬点赞👍🏻收藏📂加关注+!项目场景:近几个月可以说ChatGPT是火得一

  5. 基于RTS超低延时直播优化强互动场景体验 - 2

    RTS在阿里云视频直播的基础上进行底层技术优化,通过集成阿里云播放器SDK,支持在千万级并发场景下节点间毫秒级延时直播的能力,弥补了传统直播存在3~6秒延时的问题,确保了超低延时、低卡顿、秒开流畅的直播观看体验。本文介绍了基于RTS超低延迟直播优化强互动场景体验的最佳实践方案,并以阿里云播放器Aliplayer为例,详细介绍RTS超低延迟拉流接入、自动降级、排障信息获取等逻辑的实现,助力企业打造互动直播行业的产品竞争力。适用场景该方案适用于对超低延迟直播有诉求的客户,尤其是业务中存在强互动场景直播的场景。强互动场景直播主要是指对主播和观众存在互动,或观众存在更高实时性观看、画面互动需求的情况,

  6. ruby - Ruby 语法中 "#{}"标记的正式术语是什么? - 2

    背景我最近发布了ananswer我在不同的地方将#{}称为文字、运算符和(在一个草案中)“文字构造函数”。这个定义的模糊性并没有真正影响答案的质量,因为问题更多是关于它的作用以及如何找到它的语言引用,但我对无法准确指出规范定义感到不满怎么称呼这个Ruby语法元素。Rubymanual在关于expressionsubstitution的部分中提到了这个语法元素,但并没有真正定义语法本身的术语。几乎所有对该语言元素的引用都说它用于字符串插值,但没有定义它是什么。维基百科定义这里有一些维基百科定义暗示这个结构(严格来说)既不是文字也不是运算符。Literal(computerprogramm

  7. 评测:对接GPT-4的NewBing使用体验变化 - 2

    GPT-4是OpenAI发布的最新一代语言模型,于2023年3月14日正式发布,并通过API和ChatGPTPlus平台向用户开放。微软也证实,在GPT-4正式发布之前,就已经在部分版本的Bing中使用GPT-4技术。本文旨在对使用GPT-4技术的NewBing进行中立、专业的使用评测,探讨其使用体验的变化。界面与限额早于2月26日小编获得Newbing试用资格,届时Newbing初体验并不理想,限制多,例如对话只能持续5条自动终止,对话字符受限,生成效果不尽如人意。然而今日对接GPT-4全新bing额度扩充至15条,且对话字数扩容至2000字。Newbing提供了三种模式选项,即创造力、平衡

  8. 腾讯云区块链服务平台(TBaaS)长安链体验网络公测试用感受 - 2

    前阵InfoQ社区看到腾讯云腾讯云区块链服务平台(TBaaS)长安链体验活动,一顿操作猛如虎报了个名,体验完用一个字概括:强。非要再加几个字的话,总体感受下来装配模式灵活高效,配套工具完整辩解。话不多说开始主题本文目录结构分为区块链分类和TBaaS平台介绍、TBaaS平台上链教程三个部分一、区块链分类:大体上来说,区块链可分为公链,联盟链,私有链三种:公有链(PublicBlockchain)公有链是指任何人都能参与的区块链。公有链是去中心化程度最高的区块链,不受机构控制,整个账本对所有人公开透明。任何人都能在公有链上查询交易、发送交易、参与记账。加入公有链不需要任何人授权,可以自由加入或者离

  9. ruby - Ruby 的字符串文字并置功能的正式记录在哪里? - 2

    我最近意识到,如果您并置一系列Ruby字符串文字(例如'a'"b"'c'),则相当于这些字符串文字的串联。但是,我无法在任何地方找到这种语言功能的文档。我使用术语“并置”和“串联”进行了搜索,但只在几个StackOverflow响应中找到了对它的引用。谁能给我指出一个明确的引用? 最佳答案 更新这是nowofficiallydocumented在Ruby附带的RDoc中。更改将传播到RubyDoc下次他们构建文档时。添加的文档:Adjacentstringliteralsareautomaticallyconcatenatedbyt

  10. 云上数据变革:Databend Cloud 正式发布 - 2

    2023年4月20 日,DatabendCloud经历了近两年的打磨终于发布了!🎉此次发布会由北京数变科技有限公司【DatabendLabs】联合阿里云共同举办。DatabendCloud借助于云原生数仓Databend实现了云简单易用的大数据分析场景。以下内容来自Databend联合创始人-王吟、DatabendCloud平台负责人-李亚舟以及阿里云智能资深产品运营专家-蔡亮伟,在本次发布会上的分享总结。🙋本次发布会分为三个部分:第一部分:王吟,李亚舟分享:「 云上数据变革,DatabendCloud发布」第二部分:蔡亮伟分享:「阿里云对象存储OSS, 构建企业级数据湖底座」第三部分:在阿里

随机推荐