草庐IT

40多位学者联合发布基础模型工具学习综述,开源BMTools平台

近期,来自清华大学、中国人民大学、北京邮电大学、UIUC、NYU、CMU等高校的研究人员联合知乎、面壁智能公司探索了基础模型调用外部工具的课题,联合发表了一篇74页的基础模型工具学习综述论文,并发布了开源工具学习平台。该团队提出了基础模型工具学习的概念,系统性地整理和阐述了其技术框架,同时展示了未来可能面临的机遇和挑战。这项研究对于了解基础模型工具学习的最新进展及其未来发展趋势具有重要价值。论文链接:https://arxiv.org/abs/2304.08354BMTools工具包:https://github.com/OpenBMB/BMTools工具学习论文列表:https://gith

氢燃料电池技术综述

文章目录工作原理系统集成应用特点国家政策行业发展机遇和挑战参考文献工作原理        氢燃料电池是通过催化剂将氢气和氧气反应生成电能和水的过程,在这个过程中会伴随有热量产生。系统集成        氢燃料电池需要将氢气供应系统、氧气供应系统、电堆、冷却系统、储氢等,通过电控单元集成在一起,形成一个完整的系统。目前氢气的储存方式主要是高压储存和液态储存。应用        氢燃料电池的应用非常广泛,包括了商用车、乘用车、特种车、两轮车、轨道机车、无人机、船舶、移动式发电站等。特点        优势:相比化石能源发动机是零污染排放,相比化学电池具有更高能量密度和补能速度快等优势。      

从Google Gemini到OpenAI Q*:生成式AI研究领域全面综述

近日,来自澳大拉西亚理工学院、梅西大学和皇家墨尔本理工大学等机构的研究人员进行了一项全面的综述,深入探讨了生成式AI不断演变的格局。研究特别关注了混合专家模型(MoE)、多模态学习的变革性影响,以及对通用人工智能(AGI)的推测进展。论文地址:https://arxiv.org/abs/2312.10868- 严格审视了生成式人工智能(AI)的当前状态和未来轨迹,探索了像谷歌的Gemini和期待中的OpenAIQ*项目这样的创新是如何重塑研究优先事项和在各个领域的应用,包括对生成式AI研究分类法的影响分析。- 评估了这些技术的计算挑战、可扩展性和现实世界的影响,同时强调了它们在推动像医疗健康、

【最新综述】弱监督3D点云语义分割综述(上)

Asurveyonweaklysupervised3Dpointcloudsemanticsegmentation摘要   随着三维点云数据采集技术和传感器的普及和发展,基于深度学习的三维点云研究取得了长足进步。随着可访问数据集数量的增加,完全有监督的语义分割任务的准确性和有效性大大提高。这些方法训练神经网络,以更少的点标签来处理三维语义分割任务。除了全面概述三维点云弱监督语义分割的历史和现状之外,还详细介绍了最广泛使用的数据采集传感器、可公开访问的基准数据集列表以及未来潜在的发展方向。1.INTRODUCTION   在计算机视觉领域,人们对图像进行了广泛的研究,以支持机器理解真实世界,但二

专补大模型短板的RAG有哪些新进展?这篇综述讲明白了

大型语言模型(LLMs)已经成为我们生活和工作的一部分,它们以惊人的多功能性和智能化改变了我们与信息的互动方式。然而,尽管它们的能力令人印象深刻,但它们并非无懈可击。这些模型可能会产生误导性的“幻觉”,依赖的信息可能过时,处理特定知识时效率不高,缺乏专业领域的深度洞察,同时在推理能力上也有所欠缺。在现实世界的应用中,数据需要不断更新以反映最新的发展,生成的内容必须是透明可追溯的,以便控制成本并保护数据隐私。因此,简单依赖于这些“黑盒”模型是不够的,我们需要更精细的解决方案来满足这些复杂的需求。正是在这样的背景下,检索增强生成技术(Retrieval-AugmentedGeneration,RA

论文笔记:一分类及其在大数据中的潜在应用综述

0概述论文:Aliteraturereviewonone‑classclassificationanditspotentialapplicationsinbigdata发表:JournalofBigData在严重不平衡的数据集中,使用传统的二分类或多分类通常会导致对具有大量实例的类的偏见。在这种情况下,对少数类实例的建模和检测是非常困难的。一分类(OCC)是一种检测与已知类实例相比较的异常数据点的方法,可以用于解决与严重不平衡数据集相关的问题,这在大数据中尤其常见。我们对近十年来出版的与OCC相关的文献作品进行了详细的调查。我们将不同的工作分为三类:异常值检测、新颖性检测、深度学习和OCC。我

多模态模型技术综述

多模态架构导语1.Image2Text1.1图像数据集准备1.2图像to文本的生成模型1.2.1M2模型(Meshed—MemoryTransformer)Memory-AugmentedEncoderMeshedDecoder2.text2Image2.1生成对抗网络(GAN)2.1.1文本生成图像基础GAN2.1.2text-embedding2.1.3未来GAN发展2.2Dall-E12.2.1VAE2.3GLIDE2.3.1扩散模型3.ImagessupportingLanguageModels3.1非符号化上下文中的单词3.2词嵌入(Word-Embeddings)3.3顺序多模式嵌

面向超长上下文,大语言模型如何优化架构,这篇综述一网打尽了

ChatGPT的诞生,让基于Transformer的大型语言模型(LLM)为通用人工智能(AGI)铺开了一条革命性的道路,并在知识库、人机交互、机器人等多个领域得到应用。然而,目前存在一个普遍的限制:由于资源受限,当前大多LLM主要是在较短的文本上进行预训练,导致它们在较长上下文方面的表现较差,而长上下文在现实世界的环境中是更加常见的。最近的一篇综述论文对此进行了全面的调研,作者重点关注了基于Transformer的LLM模型体系结构在从预训练到推理的所有阶段中优化长上下文能力的进展。论文链接:https://arxiv.org/pdf/2311.12351.pdf论文首先分析了使用当前基于T

综述:看美国政府是如何塑造2023年网络安全的

随着2023年接近尾声,是时候回顾一下今年最重要的五个联邦网络故事:对显着塑造联邦层面网络安全格局的关键时刻和关键发展的汇编。这些故事强调了联邦机构在过去一年中在保护数字基础设施方面面临的挑战,并探讨了网络威胁不断变化的性质,以及解决这些威胁所需的创新应对措施。新的白宫网络安全战略白宫的国家网络安全战略代表了美国网络安全方式的决定性转变。这份长达35页的文件详细介绍了政府加强网络防御的计划,重点是减轻最终用户、小企业和地方政府的负担。该战略提议将软件安全责任转移给大公司,此举引发了网络安全界的讨论。最后,它优先考虑保护公共供水系统等关键基础设施免受网络攻击,同时为量子计算和人工智能带来的新威胁

AI安全综述

1、引言AI安全这个话题,通常会引伸出来图像识别领域的对抗样本攻击。下面这张把“熊猫”变“猴子”的攻击样例应该都不陌生,包括很多照片/视频过人脸的演示也很多。对抗样本的研究领域已经具备了一定的成熟性,有一系列的理论来论述对抗样本的存在必然性等特征。从另一角度,也可以看成是通过对抗样本来研究模型的运算机理。但AI应用更成熟的搜广推等领域,就很少看到相关研究。我认为其原因在于,缺乏足够的攻击场景支撑。比如,伪造用户行为误导AI推荐不该推荐的广告,使用特定的输入让翻译软件胡乱翻译,这些场景,想想就没有意思,自然无法引起研究兴趣。关于AI安全的全景,在论文中看到过这样一个总结,个人感觉从链路上比较完整