草庐IT

助力AI创新众智生态,全球首个十亿像素级CV挑战赛GigaVision圆满落幕

允中 2023-03-28 原文
本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。

围绕十亿像素级计算机视觉技术的2022 GigaVision 挑战赛,在经历四个月的激烈角逐后,于近日落下帷幕。

2022 GigaVision挑战赛开放百万元奖金池,面向全球高等院校、研究机构、高新企业及个人爱好者征集原创算法。

不同于其它视觉算法挑战赛,GigaVision挑战赛是全球首个针对大场景、多对象及复杂关系问题的智能算法比赛,是新一代人工智能算法的试金石。

依托自研的亿像素光场成像设备,大赛构建了具有宽视场、高分辨率的GigaVision平台,延展出当下若干人工智能技术发展的关键问题。平台目前包括两个“世界首个”级别的子项目:

  • PANDA:世界首个十亿像素级以人类为中心的视频数据集,具有大场景、多对象、长时程及复杂关系等特点;
  • GigaMVS:世界首个十亿像素级超大规模场景三维重建基准,具有规模大、细节分辨率高、遮挡复杂等特点,可使多视角三维重建与渲染问题发生质变。
值得一提的是,这已是GigaVision挑战赛连续第四年举办,且一直与CVPR、ACM MM、ECCV等顶会有着紧密合作。

那么本届GigaVision挑战赛又带了怎样的惊喜?

赛事升级 聚力创新

在GigaVision挑战赛中,每一张图片、视频的每一帧都是十亿像素级别。比如GigaMOT赛道,参赛者需要评估MOT模型在十亿像素视频中对多个目标跟踪任务的准确性,既要解决单目标跟踪任务的互相遮挡、运动模糊、拥挤场景、尺度变化等难点,又要处理目标轨迹的起始与终止、相似目标间的相互干扰等问题。特别是该赛道所使用的PANDA-Video大场景数据集,其可视范围大、拥挤行人的复杂场景等特点也为传统数据集上的MOT算法带来了新的挑战。

△基于十亿像素视频的多目标跟踪示例

又比如在GigaRendering赛道中,参赛者需要在给定的不同场景经过校准的十亿像素图像中,面对稀疏视角下的高分辨率、宽视场、细节丰富的难点,渲染生成新的RGB视图并尽可能提升其准确性。十亿像素级别的图像渲染任务,对神经辐射场的表达、规模和效率提出了更高的挑战。

△十亿像素图像渲染新视图示例

此外,偏好原始创新的测评方式亦是GigaVision挑战赛的一大亮点。传统的人工智能挑战赛任务普适性强、办赛周期短,大部分参赛队伍倾向利用成熟的理论框架和工程套路,实现系统集成和参数调优,反复刷榜。完全以分数导向的测评方式,阻碍了技术的原始创新。相比之下,GigaVision挑战赛形成了固定的举办周期,并将方法的前沿性、原创性作为排名的重要依据之一,更能鼓励参赛队伍进行原始创新。

可以看到,GigaVision挑战赛看似仍在比拼视觉智能领域的几大经典研究问题,但面向「十亿像素」级图像视频数据,赛题的前沿性、挑战性、创新性和开拓性大幅提升,与经典问题截然不同。以往将整个图像或视频放进网络中直接处理的传统方法不再奏效,仅仅使用单个模型或几个模型也很难完成这种级别的任务。因此,参赛团队会更加专注于「卷」模型架构的设计,致力于探索模型能力的上限,开展更多理论层面的创新尝试。

经过多轮比拼、线上评测、结果复现和视频答辩,本届大赛获得了多目标检测、多目标跟踪、多目标轨迹预测、3D重建、3D渲染、密集人群三维重建等方面的多个创新性解决方案,这些作品均具有很高的准确性和领先性,为十亿像素计算机视觉的发展带来了启发。

几年来,GigaVision数据平台以赛为媒,已经与CVPR、ICCV、ECCV、ACM MM等国际顶会联合举办了多届Workshops和Challenges。系列赛事的举办水平不断提升,参赛规模不断增长,关注度和影响力越来越高。

以赛为媒 推进发展

对于本届赛事的举办以及参赛选手们的优异表现,组委会专家们表达了积极的肯定和最为真实的感受。

不同赛道上涌现出多个原创算法模型,大赛专家表示对十亿像素计算机视觉的发展带来了深远的启发:“经过严谨的线上评测、结果复现和视频答辩,本届赛事共获得了多个原创算法模型,这些作品均具有很高的原创性和领先性,为十亿像素计算机视觉的发展带来了启发。”

对于3D赛道相关作品,大赛专家给予了高度评价:“3D赛道相关作品结合了数字人、元宇宙热点,具有很高应用潜力,且作品完成度较高,融合了基于人工智能的神经表征、可微渲染优化方法和基于多视图几何的立体匹配等经典方法,在算法设计和工程化实现上都颇具亮点,对大场景高精度三维重建任务具有较大的启发性,展示出了巨大的落地应用潜力。”

随着数字人、元宇宙概念的持续爆发,超高分辨率人体三维重建和新视点合成已经成为计算机视觉和计算机图形学领域的研究热点,未来可针对十亿像素级别的人体三维重建或新视点合成任务开展新的赛道,更好地支撑相关领域的发展,同时进一步扩大GigaVision挑战赛的影响力。

同时,参赛选手的“创新”和“大胆”,也被评价为推动领域发展的关键:在目标检测赛道中,参赛选手全面分析了宽视场高分辨视觉数据中场景大、对象多等新特点所带来的新问题,围绕着场景全局稀疏局部稠密、对象尺度多变形态复杂、数据通量大等挑战,提出了一系列目标检测新算法与新模型,相较现有前沿算法,实现了精度与效率的显著提升。参赛选手们的奇思妙想与大胆创新为目标检测领域提供了有效且有趣的新思路,对推动本领域的发展有重要作用。

未来,GigaVision挑战赛将不断努力,提高评价标准,提供更多的技术评价机会,邀请更多的国内外知名高校、人工智能企业以及专家学者参与评价工作,以增强评价的公正性和权威性。同时,GigaVision挑战赛将不断拓展与其他相关领域的合作,以提高竞赛的国际影响力,为人工智能领域的发展提供更多的技术支持和潜在应用。


有关助力AI创新众智生态,全球首个十亿像素级CV挑战赛GigaVision圆满落幕的更多相关文章

  1. 未来的趋势————以ChatGPT为标杆的AI对生活的影响是巨大的 - 2

    文章目录前言1.AI的发展历程2.我是如何接触到人工智能的概念和产品的3.对于ChatGPT的一点看法4.AI对大学毕业生的职业发展的利与弊5.对于AI的思考和问题前言随着ChatGPT的爆火,生成式AI,大模型的人工智能被越来越多的人注意到,同时他也带来了许多问题。本文将对几方面进行探讨。1.AI的发展历程远古时期在公元前第一个千禧年,中国,印度和希腊哲学家都提出了一些推理的研究理论,比如亚里士多德(Aristotle)进行了演绎推理三段论的完整分析,欧几里得(Euclid)所著Elements是一种形式推理的模型,MuḥammadibnMūsāal-Khwārizmī,发明了代数学,即我们

  2. 焕新古文化传承之路,AI为古彝文识别赋能 - 2

    目录1古彝文与古典保护2古文识别的挑战2.1西文与汉文OCR2.2古彝文识别难点3合合信息:古彝文保护新思路3.1图像矫正3.2图像增强3.3语义理解3.4工程技巧4总结1古彝文与古典保护彝文指的是云南、贵州、四川等地的彝族人使用的文字,区别于现代意义上的彝文,古彝文指的是在民间流通使用的原生态彝文,多达87046字。古彝文的起源距今至少数千年,是世界上最古老的文字之一。对古彝文字集研究有助于理解尚未被翻译成汉文、用字尚未规范化的古籍,更深层、透彻地作用于传统文化保护。古彝文字义对照图(网络资料+邵文苑供图)古籍是不可再生的宝贵资源,应当得到妥善保护。中国的古籍在历史上迭经水火兵燹等自然灾害、

  3. 亚马逊云科技Serverless Data:数字经济下的创新动能 - 2

    Serverless时代已经到来!企业的技术架构,总是伴随着不断增长的数据与日趋复杂的业务持续演进。如何通过构建更易用的技术架构来聚焦在业务本身,而不必在底层基础设施的管理上投入过多的精力,是数据驱动型企业需要思考的重要议题。  ServerlessData作为云原生数据服务的下一代技术架构与“新常态”,正在推动云计算的进一步发展,并且已经成为云原生数据库、大数据分析乃至人工智能等云计算服务的重要发展趋势。Serverless所带来的不仅仅是IT技术领域的创新性飞跃,同时也是数字经济趋势下,企业实现快速发展的重要机遇。十七年持续创新全方位拥抱Serverless从2006年亚马逊云科技的第一个

  4. 「认识AI:人工智能如何赋能商业」【04】机器学习的商业应用 - 2

    作者|Harper审核 |gongyouliu编辑|auroral-L机器学习的商业应用上期给大家介绍了机器学习的概念,但是理解机器学习最好方法之一,就是了解其在具体商业世界中的各种应用。在道格’罗斯的这本《认识AI,人工智能赋能商业》中,介绍了几类机器学习的商业应用,在这里我给大家归纳一下。第一,数据安全,为了避免被发现,制造恶意软件的人会不断更改代码,通常为2%~10%的修改,但是通过机器学习,安全软件可以适应这一小部分变化,并准确识别新创建的恶意软件。它还可以寻找访问方式的模式,以识别可能的安全威胁。第二,投资。机器学习使得计算机能够处理大量的财务数据,并利用其发现的规律预测市场及每只股

  5. 基于ChatGPT的智能问答、ai绘图微信小程序思路 - 2

    ChatGPT![在这里插入图片描述](https://img-blog.csdnimg.cn/186d9ecc453b48be9f19c467da7c3f07.jpegChatGPT是openai公司的一个人工智能机器人产品,目前已经升级到4.0版本。其因便捷高效,已经在大学生、IT届、科研界等领域广为流传。但是直接进入其官网使用有时候并不是那么方便,毕竟他不开放给中国用户使用,我们需要一些魔法才能用上。如果做成一个微信小程序随时随地打开就能用的话,会方便很多。正好openai官方也开放了api供开发者使用。我们可以进入openai官网https://platform.openai.com/

  6. AI 芯片的简要发展历史 - 2

    随着人工智能领域不断取得突破性进展。作为实现人工智能技术的重要基石,AI芯片拥有巨大的产业价值和战略地位。作为人工智能产业链的关键环节和硬件基础,AI芯片有着极高的技术研发和创新的壁垒。从芯片发展的趋势来看,现在仍处于AI芯片发展的初级阶段。未来将是AI芯片发展的重要阶段,无论是架构还是设计理念都存在着巨大的创新空间。一、芯片的发展历史1956年达特茅斯会议上,科学家约翰·麦卡锡,克劳德·香农和马文·明斯基提出了"人工智能"一词。50年代末,阿瑟·萨缪尔(ArthurSamuel)提出了"机器学习"这个术语,他开发了一个西洋跳棋程序,可以从错误中吸取教训,经过学习后,甚至比编写程序的人棋力更强

  7. Javascript 和 AI,事实还是虚构? - 2

    很难说出这里要问什么。这个问题模棱两可、含糊不清、不完整、过于宽泛或夸夸其谈,无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开,visitthehelpcenter.关闭11年前。在电视上我看到了一些有趣的机器人。这些有一些二极管、太阳能收集器和一些马达。二极管决定光的位置,因此它们将机器人转向为它提供光的方向。它有点跟随光。现在,基于此,我想知道一些简单的AI。有没有办法编写一个可以从用户交互中学习的引擎?作为初学者,只学习和记住用户在页面上的session就足够了。感谢任何帮助。

  8. 【3月比赛合集】20场可报名的「创新应用」和「程序设计」大奖赛,任君挑选! - 2

    CompHub 实时聚合多平台的数据类(Kaggle、天池…)和OJ类(Leetcode、牛客…)比赛。本账号同时会推送最新的比赛消息,欢迎关注!更多比赛信息见 CompHub主页 或点击文末阅读原文以下信息仅供参考,以比赛官网为准目录创新应用赛(6场比赛)程序设计赛(14场比赛)创新应用赛(6场比赛)数字医疗算法应用创新大赛——生物共融与数字疗法应用赛道🖥和鲸(Heywhale)·📅2023.02.17-2023.04.30👤90+支队伍·💰¥194,000+名企实习机会+生态合作伙伴和鲸社区-Heywhale.com第十八届“挑战杯”全国大学生课外学术科技作品竞赛“揭榜挂帅”专项赛·华为云

  9. opencv 边缘检测 cv2.Canny()详解 - 2

    👨‍💻个人简介:深度学习图像领域工作者🎉总结链接:            链接中主要是个人工作的总结,每个链接都是一些常用demo,代码直接复制运行即可。包括:                    📌1.工作中常用深度学习脚本                    📌2.torch、numpy等常用函数详解                    📌3.opencv图片、视频等操作                    📌4.个人工作中的项目总结(纯干活)              链接:https://blog.csdn.net/qq_28949847/article/details/128

  10. 仿真创新大赛—国三省一 智能鱼缸(proteus)(stm32) - 2

    ⏩大家好哇!我是小光,嵌入式爱好者,一个想要成为系统架构师的大三学生。⏩去年下半年参加了全国仿真创新大赛,也是取得了国赛三等奖,省赛一等奖的好成绩。⏩本篇文章对我们的参赛作品《智能鱼缸》做一个简介。⏩感谢你的阅读,不对的地方欢迎指正。⏩如果对代码和文档有需要私信我。————————————————智能鱼缸一、需求分析二、技术方案三、功能展示proteus仿真展示实物展示四、应用前景五、总结一、需求分析随着我国经济的发展和人民生活水平的日益增长,人们的消费观在改变,消费档次与生平都在提高,人们的生活品位越来越高,环境的个性化、环保化越来越受到人们的重视,与之相关的休闲、居家装饰等行业相应的日线蓬

随机推荐