草庐IT

Knowledge-Based

全部标签

基于深度学习的语音识别(Deep Learning-based Speech Recognition)

深度学习算法中的基于深度学习的语音识别(DeepLearning-basedSpeechRecognition)随着科技的快速发展,人工智能领域取得了巨大的进步。其中,深度学习算法以其强大的自学能力,逐渐应用于各个领域,并取得了显著的成果。在语音识别领域,基于深度学习的技术也已经成为了一种主流方法,极大地推动了语音识别技术的发展。本文将从深度学习算法的基本概念、基于深度学习的语音识别技术、应用前景和挑战等方面进行探讨。一、深度学习算法概述深度学习算法是一种神经网络算法,通过建立多层神经网络结构,模拟人脑神经元的连接方式,从而实现对输入数据的分类、识别、聚类等任务。深度学习算法可以自我学习和优化

【论文笔记】FastPillars: A Deployment-friendly Pillar-based 3D Detector

原文链接:https://arxiv.org/abs/2302.023671.引言目前基于激光雷达的主流方法分为基于点云的方法和基于体素的方法。前者能保留最多的几何信息,但点查询和遍历耗时;后者使用3D/2D卷积处理体素化点云,但用于提高效率的3D稀疏卷积在部署时会遇到困难。PointPillars作为设备部署的流行方法,使用对部署有利的2D卷积。但其使用最大池化提取每个柱体内点的特征,无法获取细粒度特征,影响最终性能(特别是对于小物体)。此外,其颈部网络FPN直接融合多尺度特征,缺少充分的特征交互。尽管PillarNet提高了PointPillars的性能,但其使用了部署困难的稀疏卷积。本文

【论文阅读】Reachability Queries with Label and Substructure Constraints on Knowledge Graphs

WanX,WangH.ReachabilityQueriesWithLabelandSubstructureConstraintsonKnowledgeGraphs[J].IEEETransactionsonKnowledgeandDataEngineering,2022.Abstract由于知识图(KGs)描述和建模了现实世界中实体和概念之间的关系,因此对KGs的推理通常对应于具有标签和实体的可达性查询穿刺约束(LSCR)。特别地,对于搜索路径p,LSCR查询不仅要求p传递的边的标签在一个特定的标签集中,而且还声称p中的一个顶点可以坐着是某个子结构约束。LSCR查询比标签约束可达性(LCR)

RAG:Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks 论文阅读

2020NeuralPS文章地址:https://arxiv.org/abs/2005.11401源码地址:GitHub-huggingface/transformers:🤗Transformers:State-of-the-artMachineLearningforPytorch,TensorFlow,andJAX.    -142RAG目录0、背景1、摘要2、导言    3、结论4、模型5、实验6、与REALM比较7、想法0、背景        LanguageModelsasKnowledgeBases?(LAMA)这篇论文作者认为现如今经过预训练之后的语言模型可以看做是一个知识库,但是

论文阅读——CRNet: Channel-Enhanced Remodeling-Based Network for Salient Object Detection in Optical

目录为什么要看这篇基本信息标题目前存在的问题改进网络结构损失函数训练测试我的总结为什么要看这篇这篇是老师发的,主要是用来解决遥感显著性检测的边缘问题基本信息期刊IEEETRANSACTIONSONGEOSCIENCEANDREMOTESENSING年份2023论文地址https://ieeexplore.ieee.org/abstract/document/10217013代码地址https://github.com/hilitteq/CRNet.git标题CRNet:一种基于网格增强重构的光学遥感图像显著目标检测网络目前存在的问题除了它们的尺寸差异之外,这些目标由于拍摄距离而具有不同的目标尺

论文阅读[2019ICASSP]Deep Reinforcement Learning-based Rate Adaptation for Adaptive 360 Video Streaming

1标题、来源、作者信息DeepReinforcementLearning-basedRateAdaptationforAdaptive360DegreeVideoStreamingPublishedin:ICASSP2019-2019IEEEInternationalConferenceonAcoustics,SpeechandSignalProcessing(ICASSP)AllAuthors:NuowenKan,JunniZou,KexinTang,ChenglinLi,NingLiu,HongkaiXiong∗SchoolofElectronicInformation&Electrica

【论文阅读】Multi-AUV Collaborative Data Collection Algorithm Based on Q-Learning in Underwater Acoustic S

文章目录论文基本信息摘要1.引言2.相关工作A.基于聚类算法的数据采集算法B.基于AUV轨迹规划的数据采集算法3.网络和通信模型A.网络模型B.问题描述C.通信模式4.THEQL-DGAALGORITHMA.OverviewoftheQL-DGAB.NodeClusteringPhaseC.AUVTaskAllocationD.AUVPathPlanning5.仿真和性能分析A.仿真参数B.结果与分析6.总结补充论文基本信息《Multi-AUVCollaborativeDataCollectionAlgorithmBasedonQ-LearninginUnderwaterAcousticSen

一文搞懂【知识蒸馏】【Knowledge Distillation】算法原理

知识蒸馏算法原理精讲文章目录知识蒸馏算法原理精讲1.什么是知识蒸馏?2.轻量化网络的方式有哪些?3.为什么要进行知识蒸馏?3.1提升模型精度3.2降低模型时延,压缩网络参数3.3标签之间的域迁移4.知识蒸馏的理论依据?5.知识蒸馏分类5.1目标蒸馏-Logits方法5.2特征蒸馏方法6.知识蒸馏的过程6.1升温(T)操作6.2温度(T)特点7.蒸馏损失计算过程8.知识蒸馏在NLP/CV中的应用8.1目标蒸馏-Logits方法应用8.2特征蒸馏方法应用9.知识蒸馏的误区参考文献1.什么是知识蒸馏?知识蒸馏就是把一个大的教师模型的知识萃取出来,把他浓缩到一个小的学生模型,可以理解为一个大的教师神经

论文解读:ChangeFormer | A TRANSFORMER-BASED SIAMESE NETWORK FOR CHANGE DETECTION

论文地址:https://arxiv.org/pdf/2201.01293.pdf项目代码:https://github.com/wgcban/ChangeFormer发表时间:2022本文提出了一种基于transformer的siamese网络架构(ChangeFormer),用于一对共配准遥感图像的变化检测(CD)。与最近基于完全卷积网络(ConvNets)的CD框架不同,该方法将分层结构的transformer编码器与多层感知(MLP)解码器统一在siamese网络体系结构中,以有效地呈现精确CD所需的多尺度远程细节。在两个CD数据集上的实验表明,所提出的端到端可训练的结构比以前的结构具

【论文阅读笔记】Attention-Based Convolutional Neural Network forEarthquake Event Classification

【论文阅读笔记】Attention-BasedConvolutionalNeuralNetworkforEarthquakeEventClassification摘要 这段摘要介绍了一篇论文,其中提出了一种带有注意力模块的深度卷积神经网络(CNN),旨在提高对各种地震事件的分类性能。研究的目标是处理所有可能的地震事件,包括微地震和人工地震,以及大地震。为了成功应对这些事件,需要合适的特征表达和一个在不利条件下能够有效区分地震波形的分类器。为了鲁棒地分类地震事件,论文提出了一种在原始地震波形上使用深度CNN和注意力模块的方法。通过代表性的实验结果,论文表明该方法为地震事件分类提供了有效的结构,并