草庐IT

OpenAI提出的新摩尔定律怎样理解?中国隐藏算力巨头有话说

本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。ChatGPT火遍全世界,与之相关的一切都在风口浪尖。OpenAI首席执行官SamAltman看似随意分享的一句话,就成为热议的焦点:新版摩尔定律很快就要来了,宇宙中的智能每18个月翻一倍。一些人猜测可能指神经网络的参数量,但和过去几年的数据并不对的上。一些人理解是包括人和AI在内所有智能体的能力,但这个指标如何衡量又成了问题。也有很多学者、网友并不认同这个判断,IBM科学家GradyBooch表示这是胡说,就被顶成了热评第一。对于这些讨论,Altman只是简单的回复了“现在还没开始”。但不管怎么说,AI飞速发展的背后

OpenAI提出的新摩尔定律怎样理解?中国隐藏算力巨头有话说

本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。ChatGPT火遍全世界,与之相关的一切都在风口浪尖。OpenAI首席执行官SamAltman看似随意分享的一句话,就成为热议的焦点:新版摩尔定律很快就要来了,宇宙中的智能每18个月翻一倍。一些人猜测可能指神经网络的参数量,但和过去几年的数据并不对的上。一些人理解是包括人和AI在内所有智能体的能力,但这个指标如何衡量又成了问题。也有很多学者、网友并不认同这个判断,IBM科学家GradyBooch表示这是胡说,就被顶成了热评第一。对于这些讨论,Altman只是简单的回复了“现在还没开始”。但不管怎么说,AI飞速发展的背后

不到1ms在iPhone12上完成推理,苹果提出移动端高效主干网络MobileOne

用于移动设备的高效神经网络主干通常针对FLOP或参数计数等指标进行优化。但当部署在移动设备上,这些指标与网络的延迟可能并没有很好的相关性。基于此,来自苹果的研究者通过在移动设备上部署多个移动友好网络对不同指标进行广泛分析,探究了现有高效神经网络的架构和优化瓶颈,提供了缓解这些瓶颈的方法。该研究设计了一个高效的主干架构MobileOne,它的变体在iPhone12上的推理时间少于1ms,在ImageNet上的top-1准确率为75.9%。论文地址:https://arxiv.org/abs/2206.04040MobileOne架构不仅实现了SOTA的性能,还在移动设备上提速了许多倍。其中,最好

不到1ms在iPhone12上完成推理,苹果提出移动端高效主干网络MobileOne

用于移动设备的高效神经网络主干通常针对FLOP或参数计数等指标进行优化。但当部署在移动设备上,这些指标与网络的延迟可能并没有很好的相关性。基于此,来自苹果的研究者通过在移动设备上部署多个移动友好网络对不同指标进行广泛分析,探究了现有高效神经网络的架构和优化瓶颈,提供了缓解这些瓶颈的方法。该研究设计了一个高效的主干架构MobileOne,它的变体在iPhone12上的推理时间少于1ms,在ImageNet上的top-1准确率为75.9%。论文地址:https://arxiv.org/abs/2206.04040MobileOne架构不仅实现了SOTA的性能,还在移动设备上提速了许多倍。其中,最好

人们提出的七个最主要的ChatGPT问题及回答

在ChatGPT和其他对话式人工智能的应用掀起热潮之后,有些人对它们仍然存在许多疑问,例如,关于生成式人工智能到底是什么以及它能为人们和企业做些什么等等。行业专家为此解答了Gartner公司的客户和供应商提出的一些最常见的问题。 1.ChatGPT将在企业中扮演什么角色? ChatGPT以及其他类似的基础模型是众多超自动化和人工智能创新之一。它将形成架构解决方案的一部分,这些解决方案可以提供自动化、增强人类或机器能力,并自主执行业务和IT流程。它还可能被用来取代、重新校准和重新定义各种工作中包含的一些活动和任务。 2.使用ChatGPT有哪些不同的方式? ChatGPT能够: ·生成并帮助改进

人们提出的七个最主要的ChatGPT问题及回答

在ChatGPT和其他对话式人工智能的应用掀起热潮之后,有些人对它们仍然存在许多疑问,例如,关于生成式人工智能到底是什么以及它能为人们和企业做些什么等等。行业专家为此解答了Gartner公司的客户和供应商提出的一些最常见的问题。 1.ChatGPT将在企业中扮演什么角色? ChatGPT以及其他类似的基础模型是众多超自动化和人工智能创新之一。它将形成架构解决方案的一部分,这些解决方案可以提供自动化、增强人类或机器能力,并自主执行业务和IT流程。它还可能被用来取代、重新校准和重新定义各种工作中包含的一些活动和任务。 2.使用ChatGPT有哪些不同的方式? ChatGPT能够: ·生成并帮助改进

GPT-3解数学题准确率升至92.5%!微软提出MathPrompter,无需微调即可打造「理科」语言模型

大型语言模型最为人诟病的缺点,除了一本正经地胡言乱语以外,估计就是「不会算数」了。比如一个需要多步推理的复杂数学问题,语言模型通常都无法给出正确答案,即便有「思维链」技术的加持,往往中间步骤也会出错。与文科类的自然语言理解任务不同,数学问题通常只有一个正确答案,在不那么开放的答案范围下,使得生成准确解的任务对大型语言模型来说更具挑战性。并且,在数学问题上,现有的语言模型通常不会对自己的答案提供置信度(confidence),让用户无从判断生成答案的可信度。为了解决这个问题,微软研究院提出了MathPrompter技术,可以提高LLM在算术问题上的性能,同时增加对预测的依赖。论文链接:https

GPT-3解数学题准确率升至92.5%!微软提出MathPrompter,无需微调即可打造「理科」语言模型

大型语言模型最为人诟病的缺点,除了一本正经地胡言乱语以外,估计就是「不会算数」了。比如一个需要多步推理的复杂数学问题,语言模型通常都无法给出正确答案,即便有「思维链」技术的加持,往往中间步骤也会出错。与文科类的自然语言理解任务不同,数学问题通常只有一个正确答案,在不那么开放的答案范围下,使得生成准确解的任务对大型语言模型来说更具挑战性。并且,在数学问题上,现有的语言模型通常不会对自己的答案提供置信度(confidence),让用户无从判断生成答案的可信度。为了解决这个问题,微软研究院提出了MathPrompter技术,可以提高LLM在算术问题上的性能,同时增加对预测的依赖。论文链接:https

AI驱动运筹优化「光刻机」!中科大等提出分层序列模型,大幅提升数学规划求解效率

数学规划求解器因其重要性和通用性,被誉为运筹优化领域的「光刻机」。其中,混合整数线性规划(Mixed-IntegerLinearProgramming,MILP)是数学规划求解器的关键组件,可建模大量实际应用,如工业排产,物流调度,芯片设计,路径规划,金融投资等重大领域。近期,中科大MIRALab王杰教授团队和华为诺亚方舟实验室联合提出分层序列模型(HierarchicalSequenceModel,HEM),大幅提升混合整数线性规划求解器求解效率,相关成果发表于ICLR2023。目前,算法已整合入华为MindSporeModelZoo模型库,相关技术和能力并将于今年内整合入华为天筹(OptV

AI驱动运筹优化「光刻机」!中科大等提出分层序列模型,大幅提升数学规划求解效率

数学规划求解器因其重要性和通用性,被誉为运筹优化领域的「光刻机」。其中,混合整数线性规划(Mixed-IntegerLinearProgramming,MILP)是数学规划求解器的关键组件,可建模大量实际应用,如工业排产,物流调度,芯片设计,路径规划,金融投资等重大领域。近期,中科大MIRALab王杰教授团队和华为诺亚方舟实验室联合提出分层序列模型(HierarchicalSequenceModel,HEM),大幅提升混合整数线性规划求解器求解效率,相关成果发表于ICLR2023。目前,算法已整合入华为MindSporeModelZoo模型库,相关技术和能力并将于今年内整合入华为天筹(OptV