草庐IT

基于逻辑规则的图谱推理

导读:近年来,知识图谱在众多行业场景被大量应用,例如推荐、医疗。为了构造尽可能完备的图谱,知识图谱的推理工作也成为学术届和工业界的一个重要研究课题。来自Mila人工智能实验室的瞿锰博士,给大家分享了他们在图谱推理任务方向的一个研究:基于逻辑规则的图谱推理(RNNLogic:LearningLogicRulesforReasoningonKnowledgeGraphs),研究结果显示RNNLogic可以很好地兼顾图谱推理任务的模型效果和可解释性的问题。本文将围绕以下几点展开:图谱和图谱推理介绍常见方法和优缺点逻辑规则学习方法RNNLogic工作展望--01图谱和图谱推理介绍知识图谱可以看作是我们

AI 模型编译器 MegCC 开源,解决推理引擎体积问题

目前社区已经有多个移动端深度学习推理框架,如:NCNN、MNN...这些推理引擎都给社区的用户带来了在移动端上部署深度学习非常多的便利,但是他们也都有一个共性问题:随着不断地迭代以及性能优化,运行时库会逐渐的增大,特别是在不同算子fuse的时候,会导致非常多的长尾算子,这就会增大我们App或者SDK的体积。为了解决这个问题,由 MegEngine 团队开源的MegCC创新使用模型预编译的方案,生成模型推理必要的代码,去除掉了和模型推理无关的代码,因此极大程度上减少了推理引擎的体积。主要方法是:将传统框架运行时的必要步骤:计算图优化、Kernel选择、内存分配都移到编译时,从而最大程度上减少了R

AI 模型编译器 MegCC 开源,解决推理引擎体积问题

目前社区已经有多个移动端深度学习推理框架,如:NCNN、MNN...这些推理引擎都给社区的用户带来了在移动端上部署深度学习非常多的便利,但是他们也都有一个共性问题:随着不断地迭代以及性能优化,运行时库会逐渐的增大,特别是在不同算子fuse的时候,会导致非常多的长尾算子,这就会增大我们App或者SDK的体积。为了解决这个问题,由 MegEngine 团队开源的MegCC创新使用模型预编译的方案,生成模型推理必要的代码,去除掉了和模型推理无关的代码,因此极大程度上减少了推理引擎的体积。主要方法是:将传统框架运行时的必要步骤:计算图优化、Kernel选择、内存分配都移到编译时,从而最大程度上减少了R

本地推理,单机运行,MacM1芯片系统基于大语言模型C++版本LLaMA部署“本地版”的ChatGPT

OpenAI公司基于GPT模型的ChatGPT风光无两,眼看它起朱楼,眼看它宴宾客,FaceBook终于坐不住了,发布了同样基于LLM的人工智能大语言模型LLaMA,号称包含70亿、130亿、330亿和650亿这4种参数规模的模型,参数是指神经网络中的权重和偏置等可调整的变量,用于训练和优化神经网络的性能,70亿意味着神经网络中有70亿个参数,由此类推。在一些大型神经网络中,每个参数需要使用32位或64位浮点数进行存储,这意味着每个参数需要占用4字节或8字节的存储空间。因此,对于包含70亿个参数的神经网络,其存储空间将分别为8GB或12GB。此外,神经网络的大小不仅取决于参数的数量,还取决于神

本地推理,单机运行,MacM1芯片系统基于大语言模型C++版本LLaMA部署“本地版”的ChatGPT

OpenAI公司基于GPT模型的ChatGPT风光无两,眼看它起朱楼,眼看它宴宾客,FaceBook终于坐不住了,发布了同样基于LLM的人工智能大语言模型LLaMA,号称包含70亿、130亿、330亿和650亿这4种参数规模的模型,参数是指神经网络中的权重和偏置等可调整的变量,用于训练和优化神经网络的性能,70亿意味着神经网络中有70亿个参数,由此类推。在一些大型神经网络中,每个参数需要使用32位或64位浮点数进行存储,这意味着每个参数需要占用4字节或8字节的存储空间。因此,对于包含70亿个参数的神经网络,其存储空间将分别为8GB或12GB。此外,神经网络的大小不仅取决于参数的数量,还取决于神

不到1ms在iPhone12上完成推理,苹果提出移动端高效主干网络MobileOne

用于移动设备的高效神经网络主干通常针对FLOP或参数计数等指标进行优化。但当部署在移动设备上,这些指标与网络的延迟可能并没有很好的相关性。基于此,来自苹果的研究者通过在移动设备上部署多个移动友好网络对不同指标进行广泛分析,探究了现有高效神经网络的架构和优化瓶颈,提供了缓解这些瓶颈的方法。该研究设计了一个高效的主干架构MobileOne,它的变体在iPhone12上的推理时间少于1ms,在ImageNet上的top-1准确率为75.9%。论文地址:https://arxiv.org/abs/2206.04040MobileOne架构不仅实现了SOTA的性能,还在移动设备上提速了许多倍。其中,最好

不到1ms在iPhone12上完成推理,苹果提出移动端高效主干网络MobileOne

用于移动设备的高效神经网络主干通常针对FLOP或参数计数等指标进行优化。但当部署在移动设备上,这些指标与网络的延迟可能并没有很好的相关性。基于此,来自苹果的研究者通过在移动设备上部署多个移动友好网络对不同指标进行广泛分析,探究了现有高效神经网络的架构和优化瓶颈,提供了缓解这些瓶颈的方法。该研究设计了一个高效的主干架构MobileOne,它的变体在iPhone12上的推理时间少于1ms,在ImageNet上的top-1准确率为75.9%。论文地址:https://arxiv.org/abs/2206.04040MobileOne架构不仅实现了SOTA的性能,还在移动设备上提速了许多倍。其中,最好

ChatGPT 等 AI 生成的内容存在常识、推理等错误,依然可以判别出来

3月18日消息,在今年2月召开的人工智能促进协会会议上,一项新研究结果表明,可以判断内容是由ChatGPT生成的还是人类撰写的。美国宾夕法尼亚大学工程与应用科学学院的一支科研团队日前展开有史以来最大规模的人工智能检测活动,基于该大学创建的网页训练游戏​​RealorFakeText?​​,收集相关数据进行培训,从而让AI可以判断出内容是由ChatGPT生成的还是人类撰写的。该研究的合著者、博士LiamDugan对此做出了解释,IT之家翻译内容如下:今天的人工智能已经可以生成出非常流畅、非常符合语法的文本。但是人工智能会犯错误。我们已经证明机器会犯诸如常识性错误、相关性错误、推理错误和逻辑错误等

ChatGPT 等 AI 生成的内容存在常识、推理等错误,依然可以判别出来

3月18日消息,在今年2月召开的人工智能促进协会会议上,一项新研究结果表明,可以判断内容是由ChatGPT生成的还是人类撰写的。美国宾夕法尼亚大学工程与应用科学学院的一支科研团队日前展开有史以来最大规模的人工智能检测活动,基于该大学创建的网页训练游戏​​RealorFakeText?​​,收集相关数据进行培训,从而让AI可以判断出内容是由ChatGPT生成的还是人类撰写的。该研究的合著者、博士LiamDugan对此做出了解释,IT之家翻译内容如下:今天的人工智能已经可以生成出非常流畅、非常符合语法的文本。但是人工智能会犯错误。我们已经证明机器会犯诸如常识性错误、相关性错误、推理错误和逻辑错误等

英伟达发布ChatGPT专用GPU,推理速度提升了10倍

曾何几时,人工智能因为算力不足进入了长达数十年的瓶颈,GPU点燃了深度学习。在ChatGPT时代,AI因为大模型再次面临算力不足的问题,这一次英伟达还有办法吗?3月22日,GTC大会正式召开,在刚刚进行的Keynote上,英伟达CEO黄仁勋搬出了为ChatGPT准备的芯片。「加速计算并非易事,2012年,计算机视觉模型AlexNet动用了GeForceGTX580,每秒可处理262PetaFLOPS。该模型引发了AI技术的爆炸,」黄仁勋说道。「十年之后,Transformer出现了,GPT-3动用了323ZettaFLOPS的算力,是AlexNet的100万倍,创造了ChatGPT这个震惊全世