草庐IT

论文选题

全部标签

论文推荐:ACMix整合self-Attention和Convolution (ACMix)的优点的混合模型

混合模型ACmix将自注意与卷积的整合,同时具有自注意和卷积的优点。这是清华大学、华为和北京人工智能研究院共同发布在2022年CVPR中的论文卷积分解与自注意力卷积分解标准卷积:重写为来自不同内核位置的特征映射的总和:这里的:为了进一步简化公式,使用Shift操作的定义:g(p,q)ij可以改写为:由上得出,标准卷积可以概括为两个阶段:在第一阶段,输入特征从某个位置(p,q)核权重进行线性投影。这与标准的1×1卷积相同。在第二阶段,投影特征图根据内核位置移动并最终聚合在一起。自注意力分解考虑一个有N个头的标准自注意模块。注意力模块的输出为:其中||是N个注意头输出的级联。注意力权重计算为:多头

【论文阅读笔记|EMNLP2023】DemoSG: Demonstration-enhanced Schema-guided Generation for Low-resource Event Ext

论文题目:DemoSG:Demonstration-enhancedSchema-guidedGenerationforLow-resourceEventExtraction论文来源:EMNLP2023论文链接:2023.findings-emnlp.121.pdf(aclanthology.org)代码链接:https://github.com/GangZhao98/DemoSG0摘要当前大多数事件抽取(EE)方法都专注于高资源场景,这需要大量的带注释数据,难以应用于低资源领域。为了更有效地应对有限资源下的EE问题,我们提出了增强演示引导生成(DemoSG)模型,它从两个方面为低资源EE提供

LLMs之Efficient-LLMs-Survey:Efficient-LLMs-Survey(高效大型语言模型综述)的简介、代表性算法论文及其代码之详细攻略

LLMs之Efficient-LLMs-Survey:Efficient-LLMs-Survey(高效大型语言模型综述)的简介、代表性算法论文及其代码之详细攻略目录相关文章LLMs:《EfficientLargeLanguageModels:ASurvey》翻译与解读LLMs之Efficient-LLMs-Survey:Efficient-LLMs-Survey(高效大型语言模型综述)的简介、代表性算法论文及其代码之详细攻略Efficient-LLMs-Survey(高效大型语言模型综述)的简介1、为什么需要高效LLMs?一、Model-CentricMethods1.1、ModelCompr

AAAI24《Knowledge-Aware Explainable Reciprocal Recommendation》论文阅读报告

代码:https://github.com/AllminerLab/Code-for-KAERR-master摘要双向推荐系统(RRS)在线上相亲和求职招聘等在线平台中得到了广泛的应用。它们可以同时满足推荐过程中涉及的两方的需求。由于任务本身的特性,与其他推荐任务相比,交互数据相对稀疏。现有的工作主要通过基于内容的推荐方法来解决这个问题。然而,这些方法通常从统一的角度隐式地对文本信息进行建模,这使得捕捉每一方持有的不同意图变得具有挑战性,进一步导致性能有限和缺乏解释性。在本文中,我们提出了一个知识感知的可解释双向推荐系统(Knowledge-AwareExplainableReciprocal

论文阅读 - Natural Language is All a Graph Needs

目录摘要IntroductionRelatedWork3InstructGLM3.1Preliminary3.2InstructionPromptDesign3.3节点分类的生成指令调整3.4辅助自监督链路预测4Experiments4.1ExperimentalSetup4.2MainResults4.2.1ogbn-arxiv 4.2.2Cora&PubMed4.3AblationStudy4.4InstructionTuningatLowLabelRatio 5FutureWork论文链接:https://arxiv.org/pdf/2308.07134.pdf摘要        Cha

ChatGPT论文:大语言模型LLM之战:Dolly、LLaMA 、Vicuna、Guanaco、Bard、ChatGPT--在自然语言转SQL(NL2SQL、Text-to-SQL)的比较(一)

摘要ChatGPT的成功引发了一场AI竞赛,研究人员致力于开发新的大型语言模型(LLMs),以匹敌或超越商业模型的语言理解和生成能力。近期,许多声称其性能接近GPT-3.5或GPT-4的模型通过各种指令调优方法出现了。作为文本到SQL解析的从业者,我们感谢他们对开源研究的宝贵贡献。然而,重要的是要带着审查意识去看待这些声明,并确定这些模型的实际有效性。因此,我们将六个流行的大型语言模型相互对比,系统评估它们在九个基准数据集上的文本到SQL解析能力,涵盖了五种不同的提示策略,包括零样本和少样本场景。遗憾的是,开源模型的性能远远低于像GPT-3.5这样的封闭源模型所取得的成绩,这凸显了进一步工作的

[论文阅读]YOLO9000:Better,Faster,Stronger

摘要我们引入了YOLO9000,一个可以检测超过9000种类别的先进的实时目标检测系统。首先我们提出了多种yolo检测方法的提升方式,既新颖又参考了之前的工作。改进后的模型,YOLOV2在标准检测任务例如PASCALVO和COCO上都取得了领先。使用一个新颖的多尺度的训练方法,同一个YOLOV2模型可以在不同尺寸下行,提供了一种速度和准确率之间的简单的平衡。在67fps下,yolov2在VOC2007上取得了78.6的mAP,在40fps下,yolov2取得了78.6的mAP,在超越现有的最先进的方法例如使用了ResNet的FasterR-CNN和SSD的同时运行速度显著的快。最后我们提出了一

基于springboot架构的购物商城网站设计与实现论文

收藏关注不迷路基于Springboot的商城系统一、摘要二、目录三、绪论1.1研究背景1.2项目研究意义1.3国内外研究现状1.4研究内容四、关键技术2.1IDEA2.2spingboot框架2.3Tomcat2.4MySQL2.5JavaEE介绍2.6Maven五、需求分析及可行性分析3.1主要目标3.2需求分析3.3可行性分析六、系统设计4.1总体设计4.2开发环境4.3业务流程分析4.4数据流程分析七、数据库设计5.1数据库概念设计5.2系统的总体E-R图5.3数据库表设计八、系统实现6.1前台6.2首页6.3商品信息6.4我的订单6.5管理员6.6管理员后台6.7系统用户管理6.8公告

论文阅读 Attention is all u need - transformer

文章目录1摘要1.1核心2模型架构2.1概览2.2理解encoder-decoder架构2.2.1对比seq2seq,RNN2.2.2我的理解3.Sublayer3.1多头注意力multi-headself-attention3.1.1缩放点乘注意力ScaledDot-ProductAttention3.1.2QKV3.1.3multi-head3.1.4masked3.2线性层MLP3.3embeddingandsoftmax3.4positionalencoding3.5dropout总结附[李沐b站对该论文理解的一些题目和答案](https://zhuanlan.zhihu.com/p/

GPT-4原论文详细解读(GPT-4 Technical Report)

GPT-4原论文详细解读(GPT-4TechnicalReport)返回论文和资料目录1.导读相比之前的GPT-3.5等大型语言模型(这里可以看我的InstructGPT解读,也方便理解本文内容),GPT-4最大的不同在于变成了多模态,即输出不变的情况下,输入可以为图片或文本。其展现了优于ChatGPT模型并且非常强大的性能。读者可在OpenAI官网体验体验,不过网页端只提供了文本输入,图片输入的方式目前只支持API。2.摘要和引言GPT-4是一个多模态的大模型。它的基础结构仍然是Transformer+预测下一个词的目标函数。GPT-4在摘要中的说法是给出了一个预测模型性能的方法,使得只需要