
@数科星球原创
作者丨苑晶
编辑丨十里香
动荡和富有戏剧性的一周行将结束,在本周,百度发布文心一言、OpenAI发布GPT-4、微软发布Microsoft 365 Copilot。围绕科技圈,人们的话题从赞叹GPT-4的强大、百度的股价再到打工人命途多舛,可谓跌宕起伏、目不暇接。
客观上,AIGC正在重构人们的办公、娱乐乃至生活方式。正如我们早先预计的那样,这场AIGC浪潮才刚刚开始。
(以下所谓AIGC指AI Generated Content即人工智能内容生成技术,目前该技术已在文字、音乐、图像、视频等领域得到应用,并在行业内诞生了不少专注于此的技术型公司)。
01
不同行业内的短期影响
从短期来看,AIGC对一些行业的改变是立竿见影的。
对软件开发行业的影响:
在年初,人们对GPT的判断仍是,它对语境理解不深入、缺乏实际编程经验,以至于无法替代程序员的工作。但时隔几周,这种看法就被重新塑造。某企业内部首席科学家对数科星球(ID:digital-planet)这样提及:“在代码检测,效率提升是明显的,以前可能我需要一百个人,现在需要十个人就够了”。
在这位高管看来,至少在软件行业,低端开发工作将更多地被取代,取而代之的是,内容生成、内容策划、数据分析师等工作可能更有前景。
对教育培训行业的影响:
在我们和不同行业的从业者对答后,发现AIGC对教育培训的影响度极为快速和深远。“我们的产品被很多做培训的人买了,比如西班牙语培训机构这种”,一位创业者表示。在培训行业,AIGC的使用者越来越多,老师们正在让生成课件等教学资源更加高效,而且,在其中,不少人还发现了个性化对学生匹配教学资源的方式。
此外,在媒体与广告行业,AIGC由于可快速生成大量的文章、视频、图片等内容极大提升了相关从业者的工作效率;
在游戏行业,AIGC还可以被用于游戏场景、角色、任务等元素的生成,为游戏开发提供更高效、更丰富的创作工具,同时也可以提高游戏的可玩性和趣味性;
在消费零售行业,该技术被用于自动生成商品描述、推荐语等内容,帮助零售商提高商品销售效率和客户满意度;
在制造和工业行业,AIGC技术可以帮助制造和工业行业生成产品设计、模拟和测试数据,从而提高产品质量和生产效率。
02
不同行业内的长期影响
GPT-4一经发布,展示了其在图片语义理解等多模态场景下的优势。“看到GPT-4能理解图片,我觉得挺惊讶的”,一位投资人对数科星球(ID:digital-planet)这样说。在他看来,以往计算机在图片语义理解上进展龟速,而目前,该项技术已经可以识别颜色、形状、纹理、深度和透视等诸多要素。
更为关键的是,深度学习算法还能自动识别对象、场景和行为信息,这点在未来应用组智能驾驶、安防监控、医学影像分析等都有极大的想象力。“虽然目前,抽象概念、情感意图和文化等还有所欠缺,但这已经是巨大的进步了”,一位从业者分析。就趋势来看,影响图片语义理解的准确性虽还有复杂场景或光照条件等因素制约,但对比过去的“龟速”,突破确实肉眼可见。
“我看到他们在ChatGPT里加了很多‘专科语料’,以至于能在更多场景中解决更多的事”,一位投资人这样说。在他看来,加入“语料”的结果是,有更多用户参与到产品之中,而在这个过程中生成了更多数据,形成了更大的用户-数据飞轮。
暴力计算、思维链、多步推理是目前GPT的特色。不过,这个类型的软件似乎存在发展上限,一些行业内人士对此的回应是;“即便是加入了多模态(包括文字在内的,图片、视频等),它根本上还在数据中‘空转’,未来还应和物理世界连接”。
与微软不同的是,谷歌将走出一条AI+物理世界的新路。因后者在物联网、传感器等方面着大量积累,以至于,在未来谷歌或将在改造物理世界上贡献非凡。在其中,一些场景被描述为:利用人工智能算法对工业生产过程进行优化,以提高生产效率和品质和利用人工智能算法对城市交通进行管理和调度,以提高交通效率和减少拥堵等。
如果把视角拉回至GPT,会发现,其图像描述、视频字幕、语音识别和对话系统领域均存在应用场景。在以上基础上,由于计算机将对语言表达有更精准理解,结合多模态数据,智能客服、智能家居、医疗等行业的智能化将有巨大飞跃。
目前,在数科星球(ID:digital-planet)所关注的项目和投资机构中,得到的最多表述是;“Domain Model(领域模型)会进一步释放AIGC的市场空间”。由于Domain Model具有在软件中实现特定业务领域实现对象和规则的能力,这样一来,开发人员便可以依据此更好地理解业务需求从而转化为代码实现。
另外,在预训练模型中数据流的输入、输出分离技术也可进一步提高AIGC的通用性和灵活性,从另一个角度而言,也降低了其部署难度。(从技术角度上,之前大模型中存在数据不匹配、模型泛化能力不足等问题,如若将输入、输出分离,可以让不同行业使用相同模型和算法,这样一来,则降低了大模型在进入细分市场的门槛和成本,也利于这类公司拥有更多的市场份额和更强的竞争力)。
03
中国企业在AIGC的破局机会
目前,在国内,AIGC同样发展迅速,文心一言的刷屏便可见一斑。较之GPT与文心一言,网络上虽有不同意见,实际上,数科星球(ID:digital-planet)认为,国内的AIGC行业正是因为焦虑的产生反而更加有前景。
在产品上,国内企业仍有较强竞争力,这体现在三个方面:
首先,国内巨头企业大多都有创造巨型用户基础产品的经验,比如在广告、社交媒体和活动等方式获取用户的经验可再次迁移。
其次,国内对产品的二次开发经验相当丰富。“我们认为,未来可能有更多更好玩的应用GPT等产品的场景存在”,一位投资人说。
再次,对比GPT未将大量资源投入中文语境的事实,一些人觉得依赖本土文化和国内数据可弥补GPT目前在这些方面的短板。
在技术突破上,仍有一些跨行技术可用于AIGC的弯道超车:
“我觉得对于中国来说还有一个利好,那就是我们在并行计算上的优势”,一位从业者这样说。在近日,硬件不足的问题受到了广泛关注,甚至有文章称发生了“几个专家抢一块卡”的事情。在一些人看来,如若将分布式计算技术应用至AIGC领域,则可通过在多台计算机并行子任务的方式提升速度和效率,而不用依赖单节点计算性能。
“对于这个问题,你可以理解成这是一个性价比关系,比如如果3090、4090显卡只有好显卡的1/2性能,但成本更低的话,那么异构计算就有可能成为现实,并有一定经济性”,一位从业者表示。(对比来说,3090和4090显卡的硬件设计在内存带宽、内存容量有瑕疵,并不具备Tensor Cores和Sparsity等技术,但如果任务规模较小或要求不是很高,3090和4090显卡也可以作为替代选择。)
还有,在国内,AIGC的应用场景仍然广阔。
“在RPA领域,AIGC可以满足软件自动化在逻辑层输入的相关需求”,一位从业者表示。在他看来,AIGC可以帮助RPA系统更好地处理复杂、结构化和非结构化数据,从而提高自动化程度和准确性。其次,AIGC可以通过分析和学习数据,实现更加智能化的RPA自动化流程,从而提高效率和降低成本。另外,AIGC还可以实现跨系统、跨部门和跨业务领域的数据共享和整合,从而实现更加全面的RPA自动化。
可以说,AIGC对于RPA行业来说是一项重要的技术进步,它将带来更高效、更智能、更全面的自动化流程,为企业带来更多的商业价值。
目前,在国内,诸如RPA行业的需求还有很多,而这一点也是国内AIGC能够最终崛起的重要参数之一。在一些人看来,AIGC由于有着天然的对To C的友好度,使得其在诸如SaaS等行业赋能场景颇多。“我们的SaaS相当于美国的1/7,在这1/7里大多数数字化需求又有80%在国营公司中,我认为AIGC是能够进一步推动这些企业进行数字化的”,一位投资者表示。
目录前言一、什么是AIGC?1、什么是PGC?2、什么是UGC?3、什么是PUCG?4、什么是AIGC?二、总结前言很明显,ChatGPT的爆火,带动了AIGC(AI-GeneratedContent)概念的火热。一、什么是AIGC?GC,全称GeneratedContent,是指创作内容。与之相对应的概念中,有PGC、UGC、PUGC、AIGC。1、什么是PGC?PGC,全称ProfessionalGeneratedContent,指专业生产内容。专业生产内容模式,主要表现为由专家或者机构来进行内容的生产,具备专业的内容生产能力,能够保证内容的专业性。主要应用在知识付费、在线教育、学习平台等
GPT-4是OpenAI发布的最新一代语言模型,于2023年3月14日正式发布,并通过API和ChatGPTPlus平台向用户开放。微软也证实,在GPT-4正式发布之前,就已经在部分版本的Bing中使用GPT-4技术。本文旨在对使用GPT-4技术的NewBing进行中立、专业的使用评测,探讨其使用体验的变化。界面与限额早于2月26日小编获得Newbing试用资格,届时Newbing初体验并不理想,限制多,例如对话只能持续5条自动终止,对话字符受限,生成效果不尽如人意。然而今日对接GPT-4全新bing额度扩充至15条,且对话字数扩容至2000字。Newbing提供了三种模式选项,即创造力、平衡
原文题目:《ACompleteSurveyonGenerativeAI(AIGC):IsChatGPTfromGPT-4toGPT-5AllYouNeed?》文章链接:https://arxiv.org/abs/2303.11717https://arxiv.org/abs/2303.11717引言:随着ChatGPT的火热传播,生成式AI(AIGC,即AI生成的内容)因其分析和创造文本、图像等能力而在各地引起了轰动。在如此强烈的媒体关注下,我们几乎不可能错过从某个角度欣赏AIGC的机会。 “一个具有未来科幻感的机器人坐着,手握画笔正在创作一幅五颜六色的图画“由dalle2创作在AI从纯分析转
【思路分析】首先,我们先重新排列一下题目所给的例子(3,2,1):0+0+0=0;(3,1,2):0+0+1=1;(2,1,3):0+0+2=2;(2,3,1):0+1+0=1;(1,3,2):0+1+1=2;(1,2,3):0+1+2=3;我们将每种排列的每个元素价值单独拿出来看看(矩阵1)000001002010011012不难发现,由每种排列的每个元素价值构成的矩阵每一列的元素重复出现,进而我们把它简化一下(矩阵2),并且计算出每一列的价值和(矩阵3)000112013这样一来规律更加清晰明了:矩阵2为n*n,n为输入值;矩阵2每一列在矩阵1对应列中重复的次数规律为其余列元素个数的积例
paddlenlp作为自然语言处理领域的全家桶,具有很多的不错的开箱即用的nlp能力。今天我们来一起看看基于paddlenlp中taskflow开箱即用的能力有哪些。第一步先升级aistudio中的paddlenlp保持最新版本。pipinstall-UpaddlenlpLookinginindexes:https://pypi.tuna.tsinghua.edu.cn/simpleRequirementalreadysatisfied:paddlenlpin/opt/conda/envs/python35-paddle120-env/lib/python3.7/site-packages(2
文心一言发布宣传视频按照发布会上说的,文心一言并非属于百度赶工抄袭Chat-GPT的作品,而是十几年一直布局AI产业厚积薄发的成果,百度在芯片,机器学习,自然语言处理,知识图谱等方面均有相对深厚的积累。国内互联网目前真正有核心竞争力的产品并不多。多数处于应用层,导致内卷无限加剧。这个姑且不算为绝对的”创新“,目前文心一言仅仅对中文训练有达到一定的成熟度,英文支持并不友好。开放内测的目的是为了,利用公共资源进一步完善文新一言训练。关于创造力的一些理论富有创造力的人通 常有他们自己的理论,而且彼此间的理论相当不同。罗伯特· 高尔文说 创造力包含预期与奉献:预期是指在其他人认识到之前,便预见到某个事
请记住,您是一位NLP领域的专家和优秀的算法工程师。使用带有tensorflow2.0subclassapi的python从头开始实现transformer模型。全部内容如下:构建transformer模型架构和依赖层;生成并预处理一些假样本数据,用于训练上面构建的模型;上面生成的样本数据的训练模型示例教程;上面生成的样本数据的预测模型示例教程;上面生成的示例数据的部署模型示例教程;最后,您所有的答案都以markdown格式呈现。You:Rememberyou’reanexpertandexcellentalgorithmengineerinNLParea.Implementtransform
今天终于收到了文学一言的测试邀请码,比很多大佬迟了几步,虽迟但到了。那么马不停蹄拿一个问题看看文心一言的回答情况。1、先来搞个事情,问下是否知道对方的存在:提问文心一言:你知道ChatGPT吗?文心一言的回答中规中矩:提问ChatGPT:你知道文心一言吗?ChatGPT回答的是“文心一言”这个词语的概念,毕竟文心一言远晚于ChatGPT发布回答的优先级不一样也正常。2、问对比对方有什么优势:提问文心一言:你对比ChatGPT有什么优势?文心一言回答更适用于中文语境:由于前面ChatGPT没有回答到百度的文心一言的概念,这里直接告诉它:心一言”(ERNIEBot)是百度开发的对标ChatGPT的
通过改变3D场景制作流程复杂、成本高、门槛高、流动性差的现状,让商家像玩转2D一样去玩转3D,让普通消费者也能参与到3D内容创作和消费中,真正实现内容生产模式从PGC/UGC过渡到AIGC,是我们3D场景智能创作引擎一直追求的目标。前言随着元宇宙的大火,国内外各大厂纷纷下场开始为下一代互联网技术布局,旨在为用户提供更好的体验。体验包括方方面面,比如更好的游戏体验、更好的社交体验、更高效的办公体验当然也包括更好的消费体验。作为国内最大的电商平台,我们团队也在持续思考如何基于元宇宙的技术,给消费者带来更好的购物体验以及给商家带来更好的营商体验。回归到电商“人、货、场”三要素上,通过虚拟人技术以及商
试图将值附加到字典上publictypealiasParameters=[String:Any]varparameters:Parameters=["username":username,"first_name":firstName,"last_name":lastName,"profession":profession]ifletimageURl=imageUrl{parameters[4]=["image_url":imageUrl]}我在线上含糊不清地提到成员的“下标”parameters[4]=["image_url":imageUrl]我该如何解决?看答案您应该访问parameter