文丨谭婧
以ChatGPT为代表的AI大模型是2023年的科技C位。
2023年3月27日,ChatGPT引发的“抓马连续剧”,又有新剧更新。
前情提要:
前美团联合创始人、高级副总裁王慧文发文宣布进入AI领域,称将打造中国的OpenAI。
新闻标题一:《王慧文放话:我先投3个亿》
当然,他现在的身份是美团非执董,北京光年之外科技有限公司股东、执董。
随后,王兴在朋友圈中表示:“……既然他决心拥抱这次大浪潮,那我必须支持。”
新闻标题二:《王兴将个人参与王慧文“光年之外”A轮投资并出任董事》
据王慧文透露,公司75%的股份用于邀请顶级研发人员。
“邀请顶级研发人员”一语亮了,值得留意。
前后脚,王慧文在帖子上说:“目前已确认三个联合创始人,一个Infra背景的联创,一个算法背景的联创,和我。”
“一个Infra(基础设施)背景的联创”这个词又亮了,这个背景的联创应在我视线范围之内。
终于,2023年3月27日,“亲爱的数据”独家获悉,前美团联合创始人王慧文团队“正在”收购国产AI框架OneFlow。


要有一场重要的会议讨论“收购事宜”,不清楚会议召开的具体时间。
这时候不用联系参加会议的任何人了,按照要求,谁也不能说交易条款的事。
鉴于发稿时间就在此事件的进展过程之中,故而无法获悉OneFlow公司的收购金额。
新闻标题三:《独家丨前美团联合创始人王慧文“正在”收购国产AI框架OneFlow,光年之外欲添新大将》

图为:一流科技创始人袁进辉
“亲爱的数据”过往相关人物文章:
简短版的介绍是:
袁进辉(老师木),2008年7月自清华大学计算机系获得工学博士学位,获得清华大学优秀博士学位论文奖,2013年加入微软亚洲研究院从事大规模机器学习平台的研发工作。
2015年至2016年底,专注于搭建基于异构集群的深度学习平台,项目荣获微软亚洲研究院院长特别奖 (top 1%)。2017年创立北京一流科技有限公司,致力于打造分布式深度学习平台。
2021年2月,一流科技由高瓴创投独家领投A轮,融资总额5000万元人民币。
关于袁进辉博士是谁,以及OneFlow是一家什么样的公司的故事,那就请看这篇文章吧。
虽然文章完稿于2021年春节,但是文中的故事并未过时。
全剧终。
One More Thing

我和AI大模型的缘分,要从2021年元宵节发布的一篇1.4万字的稿子谈起。
《搞深度学习框架的那帮人,不是疯子,就是骗子》这篇稿子发布后,遭遇了冰火两重天,号称见不多识不广的谭老师我,直接傻眼了。
一方面文章在AI领域、计算机领域百余位专家的朋友圈疯传,我的微信那几天是爆炸状态。
有很多认识的人,疯狂地给我发截图。告诉我这篇文章是如何在他们的朋友圈疯传。
一时间,我变成了一个朋友圈截图收集器,哇塞好开心。
我看到很多知名人士的转发记录,以及知名人士的群聊记录。虽未结识,但久仰大名矣。
随后不久,一位叫做谢育涛的专家致电我,他告诉我,沈向洋老师想让他代为转达,问我愿不愿意加入IDEA,主要工作是写稿。
IDEA研究院就是鼎鼎大名的粤港澳大湾区数字经济研究院。
谭老师实在水平有限。
虽然这篇文章登上了知乎的周热点,但是评论区翻车了。
好一片挖苦讽刺谩骂嘲讽之声。我当时心想,一个人一定是干了什么丧尽天良的事,才配获此“殊荣”。
甚至有人说,你不配写科技,你一个女的为什么不去写情感专栏。
哇,这真是一个好建议,我怎么没有想到。
言归正传,难能可贵的百余位专家转发,与知乎网友留言难听的冰火之别说明了什么?
很有可能说明吃瓜群众对于人工智能系统的认知和真正的专家相比,其分裂程度可能比东非大裂谷还大。
话说回来,世界顶级大型计算机系统令顶尖架构师和开发者头疼,难道写这玩意的故事的人就不头疼了吗?
做难事必有所得,头疼显然是值得的。
因为这篇文章,很多知名专家来加微信,和我聊天。一些之前写稿攒下的专家资源,也愿意把我推荐给“顶尖专家”。
求之不得,感激不尽。
一个月后,也就是2021年3月,我在杭州阿里巴巴,见到了一位叫做杨红霞的顶级人工智能专家。
看见名字里的“红”字不要怀疑,没错,女科学家。
那是一个春光明媚的晴天,湖蓝色玻璃映衬着阿里巴巴特有的橙色装饰,像跳动的钢琴键。
远远望见超大的“淘公仔”站在建筑物外墙上咧着嘴笑。
杨红霞博士朝我招手,我顺着半圆形的斜坡步行而上,也向她挥手回应。春草茵茵,行李箱轱辘哗哗作响。
那次,我们聊的是一款叫做M6的AI大模型。

丨杨红霞博士拍摄的本文作者,哈哈哈……
那天,我们也畅谈了当时最火的AI大模型GPT-3。
GPT-3在2020年6月10日发布,给中国玩家的触动很大。更直白些,中国AI科学家有压力。
阿里的会议室多得像森林里的树木,终于坐下,一张桌子,两杯咖啡。
杨红霞博士扎着利落的马尾,额前干净,没有刘海,少量碎发。
她说起话来,爽爽快快,普通话极为流利标准。
她告诉我:“我实话跟你说,为什么会回国?”
她的答案真好,连标点符号里都流露出温柔的真诚与强烈的技术愿景。
“我最喜欢的技术是从复杂的业务里抽象出来,用技术去解决实际问题。我不喜欢走反过来的路,假如走反过来的路,我可以选择去研究型的高校。”
“所有人都要有一些耐心,没有耐心,永远只有单点的结果,很难去实现线和面。”
当天的独家专访的主要内容有以下几点:
第一,如今的深度学习的模型已经不能满足我们的更多要求了。因为说白了可能这个算法模型刚出现的时候只能满足一些特别low(低)的要求,慢慢地,我们会越来越接近通用人工智能,要求的高度肯定是越来越高的。
第二,阿里巴巴希望在一些很重要的核心方向上,尤其是在支撑人工智能的下一个阶段的技术和产品上,可以做到世界领先。
第三,其他技术细节。
我就不写技术细节了,如果写了,按照谭老师做事的规矩,要先拿给该司负责这方面的同学审核才能出稿,我不写,也就免了。
可以看出,阿里巴巴很早就认得清下一代人工智能的价值,他们也很早出发了。
谈话的最后,杨红霞博士请我品尝了阿里巴巴食堂的鸭血粉丝汤,挺好吃的。
夜幕降临淘宝城,我明白了中国的AI科学家们在思考:在下一代人工智能的浪潮当中,中国到底哪些技术可以作为世界第一?
在与杨红霞博士面谈之后,我又和几位技术大佬聊过。
贾扬清,林伟(原微软亚洲研究院研究员,原微软硅谷研究院研究员,阿里云机器学习PAI平台负责人),曹政。
他们分别代表的是三层不同的内容:框架,平台,云基础设施。再算上杨红霞的模型算法团队。
一个AI大模型汇集了如此多的大佬。
可以看出,对于AI大模型,阿里投入的是整建制的团队,调动的不只是达摩院的力量。
所以,才会有M6大模型的问世。
这基本上是互联网公司制造大模型的标准打法,多个团队“共建”一个模型。
前后与多位专家多次长聊之后,我清楚地理解到,想做出超级AI大模型(那时候还没有ChatGPT),仅靠一支算法团队远远不够。
大模型团队是由几支分别擅长于不同领域(AI算力,AI框架,AI平台)的技术团队合力而成。
因为一些外力,我和杨红霞博士的故事就在这里戛然而止了,那次采访没有出稿。
2023年春节前后,我得知杨红霞博士已经去了今日头条。此后,所有人问起我关于她离职的消息,我都三缄其口。
我们聊回ChatGPT这类AI大模型。这么重要的特大工程,底层能不重要吗?
需要解释一下,在互联网大厂,底层是共用的。阿里巴巴如此,华为,腾讯,皆如此。
OneFlow的独特之处在于,这支团队挑了一个大厂云集的赛道,看上去不是去战斗,更像是去“送死”。
这是一个“置之死地,方可后生”的故事。我很激动地见证了这个故事“讲述”到今天。
在ChatGPT爆发之际,人才尤为可贵,“购买”独立团队比“挖”互联网大厂整建制的团队好操作,这也是收购可能发生的原因之一,就看袁进辉博士和光年之外谈判的价格了。
回到ChatGTP,AI算力、AI框架、AI平台、AI模型合力创造了AI大模型的成功。
当然,ChatGPT有模型层面的“独家秘方”。
为什么我一直在反复强调合力?
大家都看到了,ChatGPT和GPT-4的成功“另有高明”。
ChatGPT不是孤胆英雄的成功,而是科技巨头和通用人工智能狂人的合作,一个巨大,一个微小。
说白了,巨头微软再成功,能力再强,也没有仅凭一己之力搞定ChatGPT 。
好在,微软有眼光。OpenAI有股权结构和公司治理的神奇想法。
于是,强强联合成功。
于是,新模式成功。
同时,“亲爱的数据”获悉,中国“名列前茅”的某科技巨头已经和多支非互联网AI大模型团队见面。
其谈判策略就是:“我”作美国微软,“你”作美国OpenAI。这个策略可真好,看懂掌声。
稍微插一句,有的大厂布局了不仅仅一个GPT类型的大模型。当然,这又是另一个故事了。
总而言之,中国的大模型团队分为两种:互联网和非互联网团队。
非互联网团队包括:
前美团联合创始人王慧文团队,中科院自动化所紫东太初团队,清华系智谱华章团队,杭州的西湖心辰团队,北京的智源研究院团队,李开复的Project AI 2.0团队。
这个名单的长度还会增加,因为我看到有些投资人已经“急不可耐”了。
某AI大佬曾谈到:
“观察硬件和算力平台,如果没有某国的捣乱,整体而言,我们的硬件计算能力,计算量,以及就是说我们的一些底层的核心技术,比如说像高性能网络、高性能存储、异构计算等等。在国际上,大家的能力拉平,大同小异,更多是在强调怎么样用好这些资源。”
如今基建扎实支撑,ChatGPT这个“庞然大物”横空出世。
如今OneFlow也被知名大模型团队收购了,足见其意义。
AI新基建的范畴在变大。
一开始,GPT系列大模型不是基建。
2023年,GPT-4大模型现在已经是新基建的一部分了。
在ChatGPT引领的这一产品架构下,终端应用和底层大模型的联动十分紧密。
今天看来,AI大模型是电,我们要有自己的发电厂。
九章云极创始人方磊说:“AI大模型是电,可发电厂并不是垄断的。可以大家都盖一些发电厂。”
接下来,无论是大玩意,还是小玩意,我们把大模型玩起来,耍起来,在应用层面发展起来。
这句话不是我提的,巧了,很多AI大佬都和我说过同一句话。哪怕不是超级应用,哪怕只是做一个好用的小东西,用起来才是重要,流行起来更是王道。
接下来,就看各路大神们先如何打破ChatGPT天花板,接着再怎么做出超级应用。
啰嗦了这许多。最后我只想说,恭喜袁进辉博士,恭喜OneFlow团队。
我特别想对袁老师说:“请原谅我在股东大会还没有开完,协议还没有签下的时候就发稿。”
(这也是文章标题《前美团高管王慧文“正在”收购国产AI框架OneFlow,光年之外新联创袁进辉就位》中,“正在”一词的由来。)
都不容易,相互体谅,理解万岁。
有人在读者群问我:“中国AI大模型四小龙会是谁?”
提出这个问题的朋友的思维还停留在上一轮AI热潮。
某种意义上,AI大模型的奇点已过。
我的答案是:有可能中国AI大模型不会有四小龙,但会有多个团队争夺大模型的高地。
万一追不上怎么办?那很有可能,一家独大,大家全挂。
换句话说,我的观点是,假如美国OpenAI公司和微软公司赢家通吃,这里的赢家只有一家(一对),那会发生什么样的事情?
这样的话,可能很大一堆产业都最多成为依附在巨头API上的服务商。
这可太糟了。
好消息是,先进技术领先的时间窗口非常短暂。
坏消息是,“赢家”的布局超级迅猛。
这也反映出他们自知领先时间并不是那么多,也有很强的危机感。
中国AI大模型创业者们在焦虑中临机制变。
昔日我笔下的“骗子”已不知去向,而“疯子”在太阳升起的地方,沐浴着金色而悠远的晨光,再次出发,留给地平线崭新的背影。
有机会见证历史一刻,可真激动……
(完)

更多阅读
AI框架系列:
3.搞 AI 框架那群人(四):AI 框架前传,大数据系统 往事
4.搞 AI 框架的那群人(三):狂热的 AlphaFold 和沉默 的中国科学家
注:(三)和(四)现在并未公开发表,将会以图书出版的形式与各位见面。
漫画系列
4. AI for Science这事,到底“科学不科学”?
5. 想帮数学家,AI算老几?
11. 强化学习:人工智能下象棋,走一步,能看几步?
14. 云计算Serverless:一支穿云箭,千军万马来相见
15. 数据中心网络:数据还有5纳秒抵达战场
16. 数据中心网络“卷”AI:迟到不可怕,可怕的是别人都没迟到
17. ChatGPT大火,如何成立一家AIGC公司,然后搞钱?
18. ChatGPT:绝不欺负文科生
19.从大神Alex Smola与李沐离职AWS创业融资顺利,回看ChatGPT大模型时代“底层武器”演进
DPU芯片系列:
2. 永远不要投资DPU?
长文系列:

最后,再介绍一下主编自己吧,
我是谭婧,科技和科普题材作者。
为了在时代中发现故事,
我围追科技大神,堵截科技公司。
偶尔写小说,画漫画。
生命短暂,不走捷径。
个人微信:18611208992
原创不易,多谢转发
还想看我的文章,就关注“亲爱的数据”。
文章目录前言1.AI的发展历程2.我是如何接触到人工智能的概念和产品的3.对于ChatGPT的一点看法4.AI对大学毕业生的职业发展的利与弊5.对于AI的思考和问题前言随着ChatGPT的爆火,生成式AI,大模型的人工智能被越来越多的人注意到,同时他也带来了许多问题。本文将对几方面进行探讨。1.AI的发展历程远古时期在公元前第一个千禧年,中国,印度和希腊哲学家都提出了一些推理的研究理论,比如亚里士多德(Aristotle)进行了演绎推理三段论的完整分析,欧几里得(Euclid)所著Elements是一种形式推理的模型,MuḥammadibnMūsāal-Khwārizmī,发明了代数学,即我们
目录1古彝文与古典保护2古文识别的挑战2.1西文与汉文OCR2.2古彝文识别难点3合合信息:古彝文保护新思路3.1图像矫正3.2图像增强3.3语义理解3.4工程技巧4总结1古彝文与古典保护彝文指的是云南、贵州、四川等地的彝族人使用的文字,区别于现代意义上的彝文,古彝文指的是在民间流通使用的原生态彝文,多达87046字。古彝文的起源距今至少数千年,是世界上最古老的文字之一。对古彝文字集研究有助于理解尚未被翻译成汉文、用字尚未规范化的古籍,更深层、透彻地作用于传统文化保护。古彝文字义对照图(网络资料+邵文苑供图)古籍是不可再生的宝贵资源,应当得到妥善保护。中国的古籍在历史上迭经水火兵燹等自然灾害、
最近更新的博客华为od2023|什么是华为od,od薪资待遇,od机试题清单华为OD机试真题大全,用Python解华为机试题|机试宝典【华为OD机试】全流程解析+经验分享,题型分享,防作弊指南)华为od机试,独家整理已参加机试人员的实战技巧文章目录使用说明本期题目:卡片组成的最大数字题目输入输出描述示例一输入输出示例二输入输出Code
作者|Harper审核 |gongyouliu编辑|auroral-L机器学习的商业应用上期给大家介绍了机器学习的概念,但是理解机器学习最好方法之一,就是了解其在具体商业世界中的各种应用。在道格’罗斯的这本《认识AI,人工智能赋能商业》中,介绍了几类机器学习的商业应用,在这里我给大家归纳一下。第一,数据安全,为了避免被发现,制造恶意软件的人会不断更改代码,通常为2%~10%的修改,但是通过机器学习,安全软件可以适应这一小部分变化,并准确识别新创建的恶意软件。它还可以寻找访问方式的模式,以识别可能的安全威胁。第二,投资。机器学习使得计算机能够处理大量的财务数据,并利用其发现的规律预测市场及每只股
ChatGPT提出了"机器学习"这个术语,他开发了一个西洋跳棋程序,可以从错误中吸取教训,经过学习后,甚至比编写程序的人棋力更强
很难说出这里要问什么。这个问题模棱两可、含糊不清、不完整、过于宽泛或夸夸其谈,无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开,visitthehelpcenter.关闭11年前。在电视上我看到了一些有趣的机器人。这些有一些二极管、太阳能收集器和一些马达。二极管决定光的位置,因此它们将机器人转向为它提供光的方向。它有点跟随光。现在,基于此,我想知道一些简单的AI。有没有办法编写一个可以从用户交互中学习的引擎?作为初学者,只学习和记住用户在页面上的session就足够了。感谢任何帮助。
插件网址指路:A*PathfindingProjecthttps://arongranberg.com/astar/download3D如何简单的使用参见:A*Pathfinding插件(3D)_作孽就得先起床的博客-CSDN博客将下载好的插件导入后如何进行操作?新建一个空的CreatEmpty给它另取个名字接着添加组件接着输"path"选择第一个“Pathfinder” 选择后点击“Graphs”(图)选择第一个在打开时可能会发生折叠,点开“GridGraph”就好下面开始操作:1、勾选‘2D’2、到场景中调整覆盖区域大小,限制Ai追踪的范围 也可用边框的这里进行调整3、勾选“Use2DPh
关注公众号,发现CV技术之美本文分享论文『VideoMAE:MaskedAutoencodersareData-EfficientLearnersforSelf-SupervisedVideoPre-Training』,由南大王利民团队提出第一个VideoMAE框架,使用超高maskingratio(90%-95%),性能SOTA,代码已开源!详细信息如下:论文链接:https://arxiv.org/abs/2203.12602项目链接:https://github.com/MCG-NJU/VideoMAE 01 摘要为了在相对较小的数据集上实现卓越的性能,通常需要在超大规模数据
这几年AI绘画非常的流行,相信大家平时在浏览社交平台时,也经常看见别人发布出来的绘图作品。AI绘画不仅可以帮助许多没有绘画基础的朋友可以画出自己的作品,而且可玩性也非常的高。那大家想体验一下AI绘画的乐趣吗?如果想的话就接着看下去吧,我来告诉你智能AI绘画免费软件有哪些。推荐软件一:Styler手机端推荐理由:Styler是我个人比较喜欢使用的软件,它拥有漫画脸、卡通艺术滤镜、视频变漫画等多种特效可以使用,而且软件的AI绘图功能使用了前沿的技术,绘画出来的内容符合逻辑,不会产生太大的违和感。使用体验感:①它支持上传参考图给AI学习模仿,可以帮助大家绘画出自己想要的图案。②这个软件使用了前沿的技