何恺明MIT求职演讲现场：提前三小时就有排队，超百页PPT回顾CV发展，以及“大神月半了”

杨净鱼羊 2023-03-28 原文

本文经AI新媒体量子位（公众号ID:QbitAI）授权转载，转载请联系出处。

何恺明MIT求职演讲，真成AI圈大型追星现场了！

据量子位身处现场的听众朋友传回的消息，有同学提前3个小时已经蹲在门口排队了。

到演讲开始前半个小时，门口的队伍据说都打了好几个弯……

△后续更正，PPT不止129页

来浅浅感受一下现场的氛围：

此前何恺明回归学界的消息传出，咱们就聊过，这次Job Talk（求职演讲）代表何恺明至少已经通过了MIT的简历筛选，研究成果和能力得到了初步认可。

对于这次演讲，何恺明也是准备了超129页PPT，回顾了他在CV领域所做的工作，涵盖ResNet、Faster RCNN、Mask RCNN、MoCO和MAE。

在谈到未来工作方向时，何恺明还提到了AI for Science。

除了关心大神的演讲本身，还有网友注意到了何恺明的最新变化：

何恺明重返学界

目前，尚不能确定何恺明最后是否会和MIT成功牵手。但此次演讲，是他寻求教职传闻的靴子落地。

还有网友发现，如果何恺明最终成功入职，那么他将成为MIT被引次数最高的人。

目前，MIT全校被引用次数最高的，是化学与生物医学工程系的重量级教授Robert Langer，次数为38万+。

而何恺明被引用次数高达40万+。

其中，何恺明最出圈的研究，非ResNet莫属，在2021年底突破10万大关，如今已经涨到15万。

ResNet本身虽为计算机视觉领域研究，但其核心思想残差连接已经跨界成为现代深度学习模型的基本组件。

开启上一次AI热潮的AlphaGo Zero就是结合了ResNet+强化学习+蒙特卡洛搜索共同完成。而开启最新AI热潮的ChatGPT，其中的“T”也就是Transformer网络中同样使用了残差连接。

在计算机视觉上，何恺明的主要贡献还包括Faster R-CNN及后续的Mask R-CNN等一系列研究，在很多年都是目标检测的主流方法。

他的近期主要研究兴趣是无监督学习，21年底提出的MAE，将语言模型的掩码预训练方法用在视觉模型上，为视觉大规模无监督预训练大模型开路。最近他还将掩码方法引入众多AI绘画应用的基础模型CLIP，把训练速度提升了3.7倍。

不过也有知乎匿名用户从现场发来看法：整个Talk的质量并不好，何恺明没用一个好的故事把工作串联起来。

这是不是说明就连何恺明也不知道怎么讲好CV故事了。

三小演讲 visibility data-type style 新闻 $工作领域

有关何恺明MIT求职演讲现场：提前三小时就有排队，超百页PPT回顾CV发展，以及“大神月半了”的更多相关文章

ruby - 是否有 SproutCore 或 Cappuccino 的现场演示/示例应用程序 - 2
在他们的网站上找不到任何内容。我主要只是想看看哪个值得一试(当然是RIA)。谢谢最佳答案 SproutCoredemos 关于ruby-是否有SproutCore或Cappuccino的现场演示/示例应用程序，我们在StackOverflow上找到一个类似的问题： https://stackoverflow.com/questions/1419788/
javascript - 关于现场事件的问题 - 2
我刚刚在读http://api.jquery.com/event.stopPropagation/Sincethe.live()methodhandleseventsoncetheyhavepropagatedtothetopofthedocument,itisnotpossibletostoppropagationofliveevents我对这个说法有点困惑，有人可以用一些例子来解释一下吗？最佳答案 Live方法将处理程序绑定(bind)到文档，并从event.target属性中识别哪个元素触发了事件。所以实际的处理程序位于顶部
太高效了！ChatGPT一分钟助你完成精美PPT制作 - 2
前言在之前的文章中，我们借助ChatGPT和Xmind，仅用一分钟就成功地创建了一幅详细的思维导图：用ChatGPT三分钟生成思维导图技巧这篇文章将沿用相同的方法，让大家感受一下快速生成PPT的乐趣。作为职场人士，我们不可避免地需要制作PPT。一想到要花费大量时间进行排版和内容梳理，脑子都会感到压力。但是，通过今天的分享，这个问题将不再困扰您。本篇文章的主题：运用ChatGPT，一分钟助你完成PPT制作。利用ChatGPT创作内容提要结合Mindshow创作内容提纲首先，确定你的PPT主题。例如：以【时间管理】为例，您可以这样提问：请协助我创建一个以《时间管理》为主题的演讲稿文档，遵循以下要求
opencv 边缘检测 cv2.Canny()详解 - 2
👨‍💻个人简介：深度学习图像领域工作者🎉总结链接：链接中主要是个人工作的总结，每个链接都是一些常用demo，代码直接复制运行即可。包括： 📌1.工作中常用深度学习脚本 📌2.torch、numpy等常用函数详解 📌3.opencv图片、视频等操作 📌4.个人工作中的项目总结（纯干活）链接：https://blog.csdn.net/qq_28949847/article/details/128
opencv(12):cv::rectangle学习与代码演示，使用opencv画矩形/矩形框 - 2
1cv::rectangle介绍1.1功能：绘制一个简单的、粗的或填充的直角矩形或直角矩形框。1.2c++代码形式rectangle()[1/2]#includevoidcv::rectangle ( InputOutputArray img, Point pt1, Point pt2, constScalar& color, int thickness=1, int lineType=LINE_8, int shift=0 ) img 图像。pt1 矩形的顶点。pt2 与pt1相对的矩形的顶点。意思是pt1和pt2是对角顶点color 颜色或亮
javascript - 我如何使用 Bullet Physics 逼真地模拟高尔夫球击球？ (包括现场演示) - 2
背景我正在使用three.js和BulletPhysics库的ammo.js转换制作迷你高尔夫游戏，但我在让球真实移动时遇到了一些问题。(如果你想看看它在实践中是如何工作的，我已经在penguinspuzzle.appspot.com/minigolf.html上放了一个演示。)问题什么是让迷你高尔夫球更逼真的运动的好算法？我尝试过的在ammo.js中，有摩擦、线性阻尼和旋转阻尼的选项。随着球的滚动，摩擦设置似乎没有太大影响。我正在使用body.setRestitution(0.8);body.setFriction(1);body.setDamping(0.2,0.1);//line
javascript - 如何确定 Javascript 中的现场停留时间？ - 2
GoogleAnalytics跟踪“网站停留时间”。你将如何有效地做到这一点？它真的会跟踪用户何时关闭浏览器或离开吗？想法？最佳答案当然我不能100%确定，但我猜他们使用javascript和onload和onunload事件和/或setTimer通过AJAX与网络服务通信。这样他们就可以确定用户何时访问或离开您网站上的页面。一旦浏览器停止“ping”网络服务，就认为他们离开了您的网站。我敢肯定，无论您如何做，都会有一些误差，但您可以通过这种方式获得相当不错的估计。关于javasc
javascript - 有没有ppt模拟的javascript库？ - 2
按照目前的情况，这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持，但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开，visitthehelpcenter指导。关闭10年前。我知道有很多服务器端的ppt模拟项目，例如SlideShow(S9)。但是有没有一个javascript库可以用相当简单的语法来处理这个问题？那会更方便，因为我看不出有任何特殊原因需要涉及服务器端。更新最终用户应该只使用类似md的语法进行编辑，但Markdown不包含页面语法。按页，不是普通的分页器，而是用左/右箭头键控制。
OpenCV——Canny边缘检测（cv2.Canny()） - 2
Canny边缘检测Canny边缘检测是一种使用多级边缘检测算法检测边缘的方法。1986年，JohnF.Canny发表了著名的论文AComputationalApproachtoEdgeDetection，在该论文中详述了如何进行边缘检测。Canny()边缘检测步骤Canny边缘检测分为如下几个步骤：步骤1：去噪。噪声会影响边缘检测的准确性，因此首先要将噪声过滤掉。步骤2：计算梯度的幅度与方向。步骤3：非极大值抑制，即适当地让边缘“变瘦”。步骤4：确定边缘。使用双阈值算法确定最终的边缘信息。下面对上述步骤分别进行简单的介绍。1.应用高斯滤波去除图像噪声由于图像边缘非常容易受到噪声的干扰，因此为了
xml - Open CV 计算机视觉中的 haar 级联分类器内部是什么？ - 2
我需要将.xmlOpenCVhaar级联转换为txt文件。(OpenCV有一个基于Haar特征的级联分类器用于目标检测。)所以我需要了解xml。我想知道什么是“阶段”和“树”。树代表弱分类器吗？同一阶段的树是否组合成一个强分类器？这些阶段是级联的吗？？？在haarcascade_frontalface_alt.xml的树中，它说:37144-1.391422.04.0141958743333817e-0030.03379419073462490.8378106951713562我想知道数字代表什么。最佳答案我将尝试解释级联xml

何恺明MIT求职演讲现场：提前三小时就有排队，超百页PPT回顾CV发展，以及“大神月半了”

何恺明重返学界

有关何恺明MIT求职演讲现场：提前三小时就有排队，超百页PPT回顾CV发展，以及“大神月半了”的更多相关文章

随机推荐