草庐IT

Retrieval-augmented

全部标签

[论文阅读] |RAG评估_Retrieval-Augmented Generation Benchmark

写在前面检索增强能够有效缓解大模型存在幻觉和知识时效性不足的问题,RAG通常包括文本切分、向量化入库、检索召回和答案生成等基本步骤。近期组里正在探索如何对RAG完整链路进行评估,辅助阶段性优化工作。上周先对评估综述进行了初步的扫描,本篇分享其中一份评估benchmark,RGB。论文:https://arxiv.org/abs/2309.01431代码和数据:https://github.com/chen700564/RGBRAG评估benchmark-RGB写在前面1.核心思想2.评估维度和方式3.评估数据构建4.评估指标5.实验和结论设置5.1噪声鲁棒性5.2拒绝能力5.3信息整合能力5.

《SAIS Supervising and Augmenting Intermediate Steps for Document-Level Relation Extraction》论文阅读笔记

代码 原文地址 预备知识:1.什么是标记索引(tokenindices)?标记索引是一种用于表示文本中的单词或符号的数字编码。它们可以帮助计算机理解和处理自然语言。例如,假如有一个字典{"我":1,"是":2,"Bing":3,".":4},那么文本"我是Bing."的标记索引就是[1,2,3,4]。不同的模型或任务可能使用不同的字典或编码方式,因此标记索引也可能有所不同。 2.什么是交替段落标记索引(alternatingsegmenttokenindices)?交替段落标记索引是一种用于区分文档中不同句子的方法。它可以帮助PLM更好地理解文档的结构和语义。具体来说,就是在每个句子的开头和结

跨模态检索论文阅读:Learnable Pillar-based Re-ranking for Image-Text Retrieval(LeadRR)基于可学习支柱的图像文本检索重排

摘要图像-文本检索旨在弥合模态鸿沟,根据语义相似性检索跨模态内容。之前的工作通常侧重于成对关系(即一个数据样本是否与另一个样本匹配),但忽略了高阶邻接关系(即多个数据样本之间的匹配结构)。重新排序是一种流行的后处理方法,它揭示了在单模态检索任务中捕捉邻接关系的优越性。然而,将现有的重新排序算法直接扩展到图像文本检索中效果并不理想。本文从泛化性、灵活性、稀疏性和不对称性四个角度分析了原因,并提出了一种新颖的基于可学习支柱的重新排序范式。具体来说,我们首先选择排名靠前的模内和模间邻居作为支柱,然后利用数据样本与支柱之间的邻居关系重建数据样本。这样,每个样本只需利用相似性就能映射到多模态支柱空间,从

augmented-reality - 通过摄像机扫描 ARKit 中的 3d 对象?

这可能是一个极其困难的问题。到目前为止,ARKit可与内置于3D建模软件中的3D模型一起使用。我想知道是否有一种方法可以使用iPhone相机扫描3d物体(比如汽车),然后在ARKit中使用它。有没有在其他平台或iOS上执行此操作的可用开源项目? 最佳答案 您正在寻找“摄影测量”类别中的软件。有多种软件工具可以将您的照片拼接成3D模型,但一种选择是AutodeskRemake.有一个免费版本。 关于augmented-reality-通过摄像机扫描ARKit中的3d对象?,我们在Stack

【论文笔记】AFGRL:Augmentation-Free Self-Supervised Learning on Graphs(简要笔记供复习使用)

AFGRL:Augmentation-FreeSelf-SupervisedLearningonGraphs文献地址:Augmentation-FreeSelf-SupervisedLearningonGraphsMotivation图对比的正例对构造对增强方法敏感,由于图包含了语义信息和结构信息,因此在对边进行不同增强方法时,可能会影响其语义对不同数据分布的数据集,模型增强的参数需要分别进行调整简单的将其他节点特征看作负样本等同于忽略了图的结构信息,因此不一定从这种样本偏置中获益Comment对BGRL的工作进行了总结,认为BGRL虽然并没有使用负样本,但是利用了图增强技术,因此可能同样会损

大一统模型 Universal Instance Perception as Object Discovery and Retrieval 论文阅读笔记

UniversalInstancePerceptionasObjectDiscoveryandRetrieval论文阅读笔记一、Abstract二、引言三、相关工作实例感知通过类别名进行检索通过语言表达式的检索通过指代标注的检索统一的视觉模型UnifiedLearningParadigmsUnifiedModelArchitectures四、方法4.1Prompt生成4.2图像-Prompt特征融合4.3目标发现和检索4.4训练和推理训练推理五、实验5.1实施细节5.2在10个任务上的评估目标检测和实例分割REC和RESSOTVOSMOTMOTSVISR-VOS5.3消融和其它分析六、结论写在

跨模态检索论文阅读:Cross-Modal Implicit Relation Reasoning and Aligning for Text-to-Image Person Retrieval

Cross-ModalImplicitRelationReasoningandAligningforText-to-ImagePersonRetrieval跨模态隐式关系推理与文本对图像人物检索的比对我们提出了IRRA:一种跨模态隐式关系推理和配准框架,它可以学习局部视觉-文本标记之间的关系,并增强全局图像-文本匹配,而无需额外的先验监督。具体来说,我们首先在掩码语言建模范式中设计了一个隐式关系推理模块。该模块通过跨模态多模态交互编码器将视觉线索整合到文本标记中,从而实现跨模态交互。其次,为了对视觉和文本嵌入进行全局对齐,提出了相似性分布匹配法,以最小化图像-文本相似性分布与归一化标签匹配分布

改进召回(Retrieval)和引入重排(Reranking)提升RAG架构下的LLM应用效果

改进召回(Retrieval)和引入重排(Reranking)提升RAG架构下的LLM应用效果原创 ully AI工程化 2023-08-2421:08收录于合集#LLM应用架构3个#领域技术13个动手点关注干货不迷路如前文LLM应用架构之检索增强(RAG)的缘起与架构介绍,RAG架构很好的解决了当前大模型Promptlearning过程中contextwindow限制等问题,整体架构简明清晰,易于实现,得到了广泛的应用,但实际落地过程中有大量的实际问题需要改进优化。llamaindex实现下的RAG架构以RAG召回为例,最原始的做法是通过top-k的方式从向量数据库中检索背景数据然后直接提交

跨模态检索论文阅读:Improving Cross-Modal Retrieval With Set of Diverse Embeddings利用多样嵌入集提高跨模态检索

摘要跨图像和文本模态的跨模态检索由于其固有的模糊性而成为一项具有挑战性的任务:图像通常表现出各种情况,并且字幕可以与不同的图像相结合。基于集合的嵌入已经被研究作为这个问题的解决方案。它试图将样本编码为一组不同的嵌入向量,这些嵌入向量捕获样本的不同语义。本文提出了一种新的基于集合的嵌入方法,该方法在两个方面与以往的工作有所不同。首先,我们提出了一种新的相似性函数,称为光滑切角相似性,该函数旨在减轻现有相似性函数对基于集嵌入的副作用。其次,我们提出了一个新的集合预测模块来生成一组嵌入向量,该向量通过槽注意机制有效地捕捉输入的不同语义。我们的方法在不同视觉主干的COCO和Flickr30K数据集上进

RAG:Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks 论文阅读

2020NeuralPS文章地址:https://arxiv.org/abs/2005.11401源码地址:GitHub-huggingface/transformers:🤗Transformers:State-of-the-artMachineLearningforPytorch,TensorFlow,andJAX.    -142RAG目录0、背景1、摘要2、导言    3、结论4、模型5、实验6、与REALM比较7、想法0、背景        LanguageModelsasKnowledgeBases?(LAMA)这篇论文作者认为现如今经过预训练之后的语言模型可以看做是一个知识库,但是