草庐IT

CNN-Transformer

全部标签

Transformer面试常见问题总结

算法工程师常见面试问题总结之Transformer面试常见问题总结1.简单介绍下Transformer答:Transfomer是一种基于注意力机制的神经网络模型。Transformer模型由编码器和解码器两部分组成,其中编码器用于将输入序列编码成一个高维向量表示,解码器用于将这个向量表示解码成目标序列。Transformer模型最核心的部分是自注意力机制,它能够让模型在不同位置之间进行信息传递和交互,从而更好地学习输入序列中的信息。2.Transformer是输入是什么?答:Trransformer的输入是词向量与位置向量之和,词向量可以通过预训练的词向量模型或在模型内部学习得到。位置向量可以

【论文阅读】基于深度学习的时序异常检测——Anomaly Transformer

系列文章链接数据解读参考:数据基础:多维时序数据集简介论文一:2022AnomalyTransformer:异常分数预测论文二:2022TransAD:异常分数预测论文三:2023TimesNet:基于卷积的多任务模型论文链接:AnomalyTransformer.pdf代码链接:https://github.com/thuml/Anomaly-Transformer视频讲解(原作者禁止转载,联系的话侵删):https://www.bilibili.com/video/BV1CN4y1A7x6/?spm_id_from=333.337.search-card.all.click&vd_sour

聊聊HuggingFace Transformer

概述参见:聊聊HuggingFace项目组件一个完整的transformer模型主要包含三部分:Config、Tokenizer、Model。Config用于配置模型的名称、最终输出的样式、隐藏层宽度和深度、激活函数的类别等。示例:{"architectures":["BertForMaskedLM"],"attention_probs_dropout_prob":0.1,"gradient_checkpointing":false,"hidden_act":"gelu","hidden_dropout_prob":0.1,"hidden_size":768,"initializer_rang

卷积神经网络全解!CNN结构、训练与优化全维度介绍!

目录一、引言1.1背景和重要性1.2卷积神经网络概述二、卷积神经网络层介绍2.1卷积操作卷积核与特征映射卷积核大小多通道卷积步长与填充步长填充空洞卷积(DilatedConvolution)分组卷积(GroupedConvolution)2.2激活函数ReLU激活函数优势与劣势LeakyReLUSigmoid激活函数优势与劣势Tanh激活函数优势与劣势Swish激活函数其他激活函数激活函数的选择2.3池化层最大池化(MaxPooling)优势与劣势平均池化(AveragePooling)优势与劣势全局平均池化(GlobalAveragePooling)池化窗口大小和步长池化的替代方案池化层的选

python - CNN 中局部层和密集层的区别

卷积神经网络中的“局部”层和“密集”层有什么区别?我试图理解TensorFlow中的CIFAR-10代码,我看到它使用“本地”层而不是常规的密集层。TF中是否有支持实现“本地”层的类? 最佳答案 引自cuda-convnet:Locally-connectedlayerwithunshared-weight:Thiskindoflayerisjustlikeaconvolutionallayer,butwithoutanyweight-sharing.Thatistosay,adifferentsetoffiltersisappli

39.Isaac教程--使用 Pose CNN 解码器进行 3D 物体姿态估计

使用PoseCNN解码器进行3D物体姿态估计ISAAC教程合集地址:https://blog.csdn.net/kunhe0512/category_12163211.html文章目录使用PoseCNN解码器进行3D物体姿态估计应用概述推理模块PoseCNN解码器训练模块PoseCNN解码器架构PoseCNN解码器训练从场景二进制文件生成样本对象数据:IndustrialDolly和IndustrialBox从场景源文件为自定义对象生成数据运行PoseCNN解码器训练流程存储生成的数据以供离线训练和验证运行训练应用运行推理推理示例3D物体姿态估计评估使用模拟收集评估数据姿势估计评估姿势估计推理

[论文笔记]Glancing Transformer for Non-Autoregressive Neural Machine Translation

引言这是论文GlancingTransformerforNon-AutoregressiveNeuralMachineTranslation的笔记。传统的非自回归文本生成速度较慢,因为需要给定之前的token来预测下一个token。但自回归模型虽然效率高,但性能没那么好。这篇论文提出了GlancingTransformer,可以只需要一次解码,并行地文本生成。并且效率不输于Transformer这种自回归方法。简介Transformer变成了最广泛使用的机器翻译架构。尽管它的表现很好,但Transformer的解码是低效的因为它采用序列自回归因子分解来建模概率,见下图1a。最近关于非自回归Tr

python - 为什么二进制 Keras CNN 总是预测 1?

我想使用KerasCNN构建二元分类器。我有大约6000行输入数据,如下所示:>>print(X_train[0])[[[-1.06405307-1.06685851-1.05989663-1.06273152][-1.06295958-1.06655996-1.05969803-1.06382503][-1.06415248-1.06735609-1.05999593-1.06302975][-1.06295958-1.06755513-1.05949944-1.06362621][-1.06355603-1.06636092-1.05959873-1.06173742][-1.06

python - Tensorflow - 如何为 tf.Estimator() CNN 使用 GPU 而不是 CPU

我认为它应该与withtf.device("/gpu:0")一起使用,但我应该把它放在哪里?我不认为它是:withtf.device("/gpu:0"):tf.app.run()那么我应该把它放在tf.app的main()函数中,还是放在我用于估算器的模型函数中?编辑:如果这有帮助,这是我的main()函数:defmain(unused_argv):"""Codetoloadtrainingfoldsdatapickleorgenerateoneifnotpresent"""#CreatetheEstimatormnist_classifier=tf.estimator.Estimat

python - 卫星图像中目标检测的建议 CNN 框架?

我希望在海洋的大型卫星场景中检测船只。我申请成功了matterport'sMask-RCNNsetup在卫星图像的小子集上,但分析像WorldView这样的大图像太慢了。我正在寻找可以快速处理边界框的东西,它是在python中,在Keras中实现的,并且针对卫星图像进行了理想的优化(或有据可查,以便我可以对其进行优化)。有什么建议吗?我发现了一些有希望的线索:YouOnlyLookTwice,针对卫星图像优化的YOLO变体,但用C语言构建,没有很好的文档记录代码:https://github.com/avanetten/yolt论文:https://arxiv.org/pdf/1805