草庐IT

多模态推荐系统综述

推荐系统(RS)已经成为在线服务不可或缺的工具。它们集成了各种深度学习技术,可以根据标识符和属性信息对用户偏好进行建模。随着短视频、新闻等多媒体服务的出现,在推荐的同时了解这些内容变得至关重要。此外,多模态特征也有助于缓解RS中的数据稀疏问题。因此,多模态推荐系统(multimodalrecommendationsSystem,MRS)近年来受到了学术界和业界的广泛关注。在本文中,我们将主要从技术角度对MRS模型进行全面的综述。本文首先总结了MRS模型的一般流程和面临的主要挑战,然后分别从特征交互、特征增强和模型优化三个方面介绍了现有的MRS模型。为了方便那些想要研究这个领域的人,我们还总结了

顶刊TPAMI 2022!基于不同数据模态的行为识别:最新综述

点击下方卡片,关注“CVer”公众号AI/CV重磅干货,第一时间送达点击进入—> CV 微信技术交流群HumanActionRecognitionfromVariousDataModalities:AReview论文:https://arxiv.org/abs/2012.118661.介绍人类行为识别旨在了解人类的行为,并为行为指定标签,例如,握手、吃东西、跑步等。它具有广泛的应用前景,因此在计算机视觉领域受到越来越多的关注。人类行为可以使用各种数据模态来表示,如RGB、骨架、深度、红外序列、点云、事件流、音频、加速信号、雷达和WiFi,这些数据模态在不同的场景下具有不同的优势。因此,现有的论

复旦NLP团队发布80页大模型Agent综述,一文纵览AI智能体的现状与未来

近期,复旦大学自然语言处理团队(FudanNLP)推出LLM-basedAgents综述论文,全文长达86页,共有600余篇参考文献!作者们从AIAgent的历史出发,全面梳理了基于大型语言模型的智能代理现状,包括:LLM-basedAgent的背景、构成、应用场景、以及备受关注的代理社会。同时,作者们探讨了Agent相关的前瞻开放问题,对于相关领域的未来发展趋势具有重要价值。论文链接:https://arxiv.org/pdf/2309.07864.pdfLLM-basedAgent论文列表:https://github.com/WooooDyy/LLM-Agent-Paper-List团队

李沐论文精读系列三:MoCo、对比学习综述(MoCov1/v2/v3、SimCLR v1/v2、DINO等)

文章目录一、MoCo1.1导言1.1.1前言1.1.2摘要1.1.3导言1.2相关工作1.2.1SimCLR:端到端的学习方式(InvaSpread也是)1.2.2memorybank(InstDisc模型)1.3算法1.3.1损失函数1.3.2伪代码1.4实验1.4.1对比其他模型1.4.2imagenet数据集结果对比1.4.3迁移学习效果1.5总结二、对比学习论文综述三、第一阶段:百花齐放(2018-2019Mid)3.1InstDisc(instancediscrimination)3.1.1研究动机3.1.2算法3.1.3NCELoss损失函数3.1.4ProximalRegular

AI海洋中的海妖之歌:腾讯AI Lab大模型幻觉问题综述

大规模语言模型在众多下游任务中展现了惊人的能力,但它们在使用中仍然暴露了一些问题。其中,幻觉是目前影响大模型落地的重要问题之一。ChatGPT的发布使学术界和工业界关注大模型实际落地的潜能,大量关于幻觉的工作也开始涌现。近期,腾讯AILab联合国内外多家学术机构发布了面向大模型幻觉工作的综述,对幻觉的评估、溯源、缓解等进行了全面的探讨。论文链接:https://arxiv.org/abs/2309.01219Github链接:https://github.com/HillZhang1999/llm-hallucination-survey什么是大模型幻觉问题?根据相关工作和平时对大模型的使用体

文献阅读笔记 # 开源软件供应链安全研究综述

纪守领,王琴应,陈安莹,赵彬彬,叶童,张旭鸿,吴敬征,李昀,尹建伟,武延军.开源软件供应链安全研究综述.软件学报.http://www.jos.org.cn/1000-9825/6717.htm主要作者来自浙江大学、中科院软件所、华为资源:pdf摘要本文总结了开源软件供应链的关键环节,基于近10年的攻击事件总结了开源软件供应链的威胁模型和安全趋势,并通过对现有安全研究成果的调研分析,从风险识别和加固防御两个方面总结了开源软件供应链安全的研究现状,最后对开源软件供应链安全所面临的挑战和未来研究方向进行了展望和总结。1开源软件供应链模型软件供应链:定义一:通过一级或多级软件设计、开发阶段编写软件,

遥感图像目标检测研究综述

遥感图像目标检测遥感图像特殊性一、目标检测研究综述1.介绍2.传统目标检测3.基于深度学习目标检测R-CNN系列为代表的两阶段算法YOLO、SSD为代表的一阶段算法二、多尺度目标检测研究综述1.基于图像金字塔的多尺度目标检测基于尺度生成网络的图像金字塔基于尺度归一化的图像金字塔基于注意力机制的图像金字塔2.基于网络内特征金字塔的多尺度目标检测基于跨层连接构建特征金字塔基于并行支路构建特征金字塔3.多尺度目标检测的其他策略锚点交并比阈值动态卷积边界框损失函数解耦分类与定位小目标特征重建数据增强三、其他目标检测任务四、评估目标探测器的有效性遥感图像特殊性尺度多样性:航空遥感图像可从几百米到近万米的

小样本图像目标检测研究综述——张振伟论文阅读

小样本图像目标检测研究综述——张振伟(计算机工程与应用2022)论文阅读目前,小样本图像目标检测方法多基于经典的俩阶段目标检测算法FasterR-CNN作为主干网络,当然也有将YOLO,SSD一阶段目标检测算法作为主干网络的。检测过程中不仅需要提取分类任务所关注的高层语义信息,还要获取低层级像素级信息实现目标的定位。1、方法分类1.2.1基于度量学习方法基于度量学习的方法是在获取潜在目标区域特征的前提下,将目标区域特征和支持图像特征转换到相同的嵌入空间,通过计算距离或者相似度对潜在的目标区域进行分类,进而实现对图像中不同目标的检测。==基于度量学习的方法另一个研究的重点是损失函数设计。一个有效

前沿综述 | 空间转录组学入门指南

目前关于空间转录组学的许多文献是技术性的,并不面向不熟悉该领域的研究人员。近日,《GenomeMedicine》发表了一篇综述文章为空间转录组学提供了一个入门指南:涵盖了生物医学研究所需的可用技术、实验设计考虑和生物信息学分析。空间转录组技术已经存在了近十年。目前商业化的技术,如10XGenomics公司发布的Visium,以及Nanostring公司的GeoMx和CosMx,已经使空间转录组学更容易获得。其他组学技术,如"空间蛋白质组学"(目前用于描述通过基于抗体的方法对几十种蛋白质进行定向评估的术语)、染色质可及性的空间检测和空间基因组学也有新发现。同时,空间转录组已广泛应用于生物医学领域

顶刊TPAMI 2023!生成式AI与图像合成综述发布!

本文经自动驾驶之心公众号授权转载,转载请联系出处。生成式AI作为当前人工智能领域的前沿技术,已被广泛的应用于各类视觉合成任务。随着DALL-E2,StableDiffusion和DreamFusion的发布,AI作画和3D合成实现了令人惊叹的视觉效果并且在全球范围内的爆炸式增长。这些生成式AI技术深刻地拓展了人们对于AI图像生成能力的认识,那么这些生成式AI方法是如何生成以假乱真的视觉效果?又是如何利用深度学习和神经网络技术来实现画作、3D生成以及其他创造性任务的呢?我们的综述论文将会给您提供这些问题的答案。论文:https://arxiv.org/abs/2112.13592GitHub地址