文章目录一、摘要二、介绍三、相关研究3.1基于机动的模型3.2交互感知模型3.3运动预测的递归网络四、问题制定4.1参照系4.2输入输出4.3概率运动预测4.4操作类别五、模型5.1LSTM编码器5.2ConvolutionalSocialPooling卷积社交池化5.3基于机动的LSTM解码器5.4训练和实施细节六、实验评估6.1数据集6.2评估指标6.3模型比较6.3.1与其他模型的比较6.3.2修改本模型配置来对照6.3.3比较结果6.3.4全连接与卷积社会池化的比较6.3.5单模态与多模态预测的比较6.3.6周围车辆对预测的影响参考文献:一、摘要预测周围车辆的运动是部署在复杂交通中的自
下面所有博客是个人对EEG脑电的探索,项目代码是早期版本不完整,需要完整项目代码和资料请私聊。数据集1、脑电项目探索和实现(EEG)(上):研究数据集选取和介绍SEED相关论文阅读分析:1、EEG-SEED数据集作者的—基线论文阅读和分析2、图神经网络EEG论文阅读和分析:《EEG-BasedEmotionRecognitionUsingRegularizedGraphNeuralNetworks》3、EEG-GNN论文阅读和分析:《EEGEmotionRecognitionUsingDynamicalGraphConvolutionalNeuralNetworks》4、论文阅读和分析:Mas
单通道说话人语音分离——Conv-TasNet模型(ConvolutionalTime-domainaudioseparationNetwork)参考文献:《Conv-TasNet:SurpassingIdealTime-FrequencyMagnitudeMaskingforSpeechSeparation》1.背景 在真实的声学环境中,鲁棒的语音处理通常需要自动的语音分离。由于这一研究课题对语音处理技术的重要性,人们已经提出了许多方法来解决这一问题。然而,语音分离的准确性,特别是对新演讲者,仍然不够。 大多数以前的语音分离方法都是在混合信号的时频(T-F,或谱图
这篇文章结合了TDAN中时间可变形网络的优势和Robust-VSR中融合注意力机制的优势,在此基础上注入了金字塔结构,提出了一种新的VSR方法EDVR(EnhancedDeformableVideoRestoration),主要分为两个具体部分:金字塔级联可变形对齐网络(PCD)和时空注意力融合超分网络(TSA)。是适用于多种视频恢复任务的通用体系结构,包括超分辨率、去模糊、去噪、去块等。原文链接:EDVR:VideoRestorationwithEnhancedDeformableConvolutionalNetworks[CVPR2019]参考目录:超分之EDVRTDAN:Temporal
这篇文章结合了TDAN中时间可变形网络的优势和Robust-VSR中融合注意力机制的优势,在此基础上注入了金字塔结构,提出了一种新的VSR方法EDVR(EnhancedDeformableVideoRestoration),主要分为两个具体部分:金字塔级联可变形对齐网络(PCD)和时空注意力融合超分网络(TSA)。是适用于多种视频恢复任务的通用体系结构,包括超分辨率、去模糊、去噪、去块等。原文链接:EDVR:VideoRestorationwithEnhancedDeformableConvolutionalNetworks[CVPR2019]参考目录:超分之EDVRTDAN:Temporal
不足之处请大家多多指点!文章目录链接代码详解链接论文题目:用图卷积网络进行自监督分类(GCN)(2017ICLR)论文链接:1609.02907v3.pdf(arxiv.org)代码链接:tkipf/pygcn:GraphConvolutionalNetworksinPyTorch(github.com)代码讲解(非本人):4.1_GCN代码_哔哩哔哩_bilibili注意:这里给的代码链接是用PyTorch实现的,原始论文中的代码是用Tensorflow实现的,有兴趣的可以自己玩:tkipf/gcn:ImplementationofGraphConvolutionalNetworksinTe
ICLR20180abstract交通预测是一项具有挑战的任务对道路网络的复杂空间依赖性随道路条件变化的非线性时间动态长期预测的固有困难——>将交通流建模为有向图上的扩散过程——>引入扩散卷积递归神经网络(DCRNN)使用图上的双向随机游走来捕获空间依赖性使用具有计划采样(scheduledsampling)的编码器-解码器架构来捕获时间依赖性1introduction1.1 交通预测的挑战性复杂的时空依赖性+长期预测的固有困难交通时间序列表现出强烈的时间动态。高峰时间或事故等可能会导致非平稳性,从而难以长期预测。道路网络上的传感器包含复杂而独特的空间相关性road1和road2同向相邻,所以
1前言 实验表明,RNN在几乎所有的序列问题上都有良好表现,包括语音/文本识别、机器翻译、手写体识别、序列数据分析(预测)等。 在实际应用中,RNN在内部设计上存在一个严重的问题:由于网络一次只能处理一个时间步长,后一步必须等前一步处理完才能进行运算。这意味着RNN不能像CNN那样进行大规模并行处理,特别是在RNN/LSTM对文本进行双向处理时。这也意味着RNN极度地计算密集,因为在整个任务运行完成之前,必须保存所有的中间结果。 CNN在处理图像时,将图像看作一个二维的“块”(m*n的矩阵)。迁移到时间序列上,就可以将序列看作一个一维对象(1*n的向量)。通过多层网络结构,可
1前言 实验表明,RNN在几乎所有的序列问题上都有良好表现,包括语音/文本识别、机器翻译、手写体识别、序列数据分析(预测)等。 在实际应用中,RNN在内部设计上存在一个严重的问题:由于网络一次只能处理一个时间步长,后一步必须等前一步处理完才能进行运算。这意味着RNN不能像CNN那样进行大规模并行处理,特别是在RNN/LSTM对文本进行双向处理时。这也意味着RNN极度地计算密集,因为在整个任务运行完成之前,必须保存所有的中间结果。 CNN在处理图像时,将图像看作一个二维的“块”(m*n的矩阵)。迁移到时间序列上,就可以将序列看作一个一维对象(1*n的向量)。通过多层网络结构,可
近期开始阅读cv领域的一些经典论文,本文整理计算机视觉的奠基之作——Alexnet论文原文:ImageNetClassificationwithDeepConvolutionalNeuralNetworks(有需要论文原文的可以私信联系我)本文的阅读方法是基于李沐老师的B站讲解视频,需要细致去看的小伙伴可以去搜索,链接如下:9年后重读深度学习奠基作之一:AlexNet【论文精读】_哔哩哔哩_bilibili本文整理用于之后自己能够更快的回忆起这篇论文,所以有些地方记录的可能没那么严谨,有问题的地方欢迎各位指出和讨论,我及时修改,谢谢各位!如果该论文笔记对你有所帮助,希望可以点个赞关注一下,之后