草庐IT

何恺明MIT求职演讲现场:提前三小时就有排队,超百页PPT回顾CV发展,以及“大神月半了”

杨净 鱼羊 2023-03-28 原文
本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。

何恺明MIT求职演讲,真成AI圈大型追星现场了!

据量子位身处现场的听众朋友传回的消息,有同学提前3个小时已经蹲在门口排队了。

到演讲开始前半个小时,门口的队伍据说都打了好几个弯……

△后续更正,PPT不止129页

来浅浅感受一下现场的氛围:

此前何恺明回归学界的消息传出,咱们就聊过,这次Job Talk(求职演讲)代表何恺明至少已经通过了MIT的简历筛选,研究成果和能力得到了初步认可。

对于这次演讲,何恺明也是准备了超129页PPT,回顾了他在CV领域所做的工作,涵盖ResNet、Faster RCNN、Mask RCNN、MoCO和MAE。

在谈到未来工作方向时,何恺明还提到了AI for Science。

除了关心大神的演讲本身,还有网友注意到了何恺明的最新变化:

何恺明重返学界

目前,尚不能确定何恺明最后是否会和MIT成功牵手。但此次演讲,是他寻求教职传闻的靴子落地。

还有网友发现,如果何恺明最终成功入职,那么他将成为MIT被引次数最高的人。

目前,MIT全校被引用次数最高的,是化学与生物医学工程系的重量级教授Robert Langer,次数为38万+。

而何恺明被引用次数高达40万+

其中,何恺明最出圈的研究,非ResNet莫属,在2021年底突破10万大关,如今已经涨到15万。

ResNet本身虽为计算机视觉领域研究,但其核心思想残差连接已经跨界成为现代深度学习模型的基本组件

开启上一次AI热潮的AlphaGo Zero就是结合了ResNet+强化学习+蒙特卡洛搜索共同完成。而开启最新AI热潮的ChatGPT,其中的“T”也就是Transformer网络中同样使用了残差连接。

在计算机视觉上,何恺明的主要贡献还包括Faster R-CNN及后续的Mask R-CNN等一系列研究,在很多年都是目标检测的主流方法。

他的近期主要研究兴趣是无监督学习,21年底提出的MAE,将语言模型的掩码预训练方法用在视觉模型上,为视觉大规模无监督预训练大模型开路。最近他还将掩码方法引入众多AI绘画应用的基础模型CLIP,把训练速度提升了3.7倍。

不过也有知乎匿名用户从现场发来看法:整个Talk的质量并不好,何恺明没用一个好的故事把工作串联起来。

这是不是说明就连何恺明也不知道怎么讲好CV故事了。


有关何恺明MIT求职演讲现场:提前三小时就有排队,超百页PPT回顾CV发展,以及“大神月半了”的更多相关文章

  1. ruby - 是否有 SproutCore 或 Cappuccino 的现场演示/示例应用程序 - 2

    在他们的网站上找不到任何内容。我主要只是想看看哪个值得一试(当然是RIA)。谢谢 最佳答案 SproutCoredemos 关于ruby-是否有SproutCore或Cappuccino的现场演示/示例应用程序,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/1419788/

  2. javascript - 关于现场事件的问题 - 2

    我刚刚在读http://api.jquery.com/event.stopPropagation/Sincethe.live()methodhandleseventsoncetheyhavepropagatedtothetopofthedocument,itisnotpossibletostoppropagationofliveevents我对这个说法有点困惑,有人可以用一些例子来解释一下吗? 最佳答案 Live方法将处理程序绑定(bind)到文档,并从event.target属性中识别哪个元素触发了事件。所以实际的处理程序位于顶部

  3. 太高效了!ChatGPT一分钟助你完成精美PPT制作 - 2

    前言在之前的文章中,我们借助ChatGPT和Xmind,仅用一分钟就成功地创建了一幅详细的思维导图:用ChatGPT三分钟生成思维导图技巧这篇文章将沿用相同的方法,让大家感受一下快速生成PPT的乐趣。作为职场人士,我们不可避免地需要制作PPT。一想到要花费大量时间进行排版和内容梳理,脑子都会感到压力。但是,通过今天的分享,这个问题将不再困扰您。本篇文章的主题:运用ChatGPT,一分钟助你完成PPT制作。利用ChatGPT创作内容提要结合Mindshow创作内容提纲首先,确定你的PPT主题。例如:以【时间管理】为例,您可以这样提问:请协助我创建一个以《时间管理》为主题的演讲稿文档,遵循以下要求

  4. opencv 边缘检测 cv2.Canny()详解 - 2

    👨‍💻个人简介:深度学习图像领域工作者🎉总结链接:            链接中主要是个人工作的总结,每个链接都是一些常用demo,代码直接复制运行即可。包括:                    📌1.工作中常用深度学习脚本                    📌2.torch、numpy等常用函数详解                    📌3.opencv图片、视频等操作                    📌4.个人工作中的项目总结(纯干活)              链接:https://blog.csdn.net/qq_28949847/article/details/128

  5. opencv(12):cv::rectangle学习与代码演示,使用opencv画矩形/矩形框 - 2

    1cv::rectangle介绍1.1功能:        绘制一个简单的、粗的或填充的直角矩形或直角矩形框。1.2c++代码形式rectangle()[1/2]#includevoidcv::rectangle ( InputOutputArray img, Point pt1, Point pt2, constScalar& color, int thickness=1, int lineType=LINE_8, int shift=0 ) img  图像。pt1     矩形的顶点。pt2     与pt1相对的矩形的顶点。意思是pt1和pt2是对角顶点color  颜色或亮

  6. javascript - 我如何使用 Bullet Physics 逼真地模拟高尔夫球击球? (包括现场演示) - 2

    背景我正在使用three.js和BulletPhysics库的ammo.js转换制作迷你高尔夫游戏,但我在让球真实移动时遇到了一些问题。(如果你想看看它在实践中是如何工作的,我已经在penguinspuzzle.appspot.com/minigolf.html上放了一个演示。)问题什么是让迷你高尔夫球更逼真的运动的好算法?我尝试过的在ammo.js中,有摩擦、线性阻尼和旋转阻尼的选项。随着球的滚动,摩擦设置似乎没有太大影响。我正在使用body.setRestitution(0.8);body.setFriction(1);body.setDamping(0.2,0.1);//line

  7. javascript - 如何确定 Javascript 中的现场停留时间? - 2

    GoogleAnalytics跟踪“网站停留时间”。你将如何有效地做到这一点?它真的会跟踪用户何时关闭浏览器或离开吗?想法? 最佳答案 当然我不能100%确定,但我猜他们使用javascript和onload和onunload事件和/或setTimer通过AJAX与网络服务通信。这样他们就可以确定用户何时访问或离开您网站上的页面。一旦浏览器停止“ping”网络服务,就认为他们离开了您的网站。我敢肯定,无论您如何做,都会有一些误差,但您可以通过这种方式获得相当不错的估计。 关于javasc

  8. javascript - 有没有ppt模拟的javascript库? - 2

    按照目前的情况,这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持,但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开,visitthehelpcenter指导。关闭10年前。我知道有很多服务器端的ppt模拟项目,例如SlideShow(S9)。但是有没有一个javascript库可以用相当简单的语法来处理这个问题?那会更方便,因为我看不出有任何特殊原因需要涉及服务器端。更新最终用户应该只使用类似md的语法进行编辑,但Markdown不包含页面语法。按页,不是普通的分页器,而是用左/右箭头键控制。

  9. OpenCV——Canny边缘检测(cv2.Canny()) - 2

    Canny边缘检测Canny边缘检测是一种使用多级边缘检测算法检测边缘的方法。1986年,JohnF.Canny发表了著名的论文AComputationalApproachtoEdgeDetection,在该论文中详述了如何进行边缘检测。Canny()边缘检测步骤Canny边缘检测分为如下几个步骤:步骤1:去噪。噪声会影响边缘检测的准确性,因此首先要将噪声过滤掉。步骤2:计算梯度的幅度与方向。步骤3:非极大值抑制,即适当地让边缘“变瘦”。步骤4:确定边缘。使用双阈值算法确定最终的边缘信息。下面对上述步骤分别进行简单的介绍。1.应用高斯滤波去除图像噪声由于图像边缘非常容易受到噪声的干扰,因此为了

  10. xml - Open CV 计算机视觉中的 haar 级联分类器内部是什么? - 2

    我需要将.xmlOpenCVhaar级联转换为txt文件。(OpenCV有一个基于Haar特征的级联分类器用于目标检测。)所以我需要了解xml。我想知道什么是“阶段”和“树”。树代表弱分类器吗?同一阶段的树是否组合成一个强分类器?这些阶段是级联的吗???在haarcascade_frontalface_alt.xml的树中,它说:37144-1.391422.04.0141958743333817e-0030.03379419073462490.8378106951713562我想知道数字代表什么。 最佳答案 我将尝试解释级联xml

随机推荐