草庐IT

【Transformer论文】CMKD:用于音频分类的基于 CNN/Transformer 的跨模型知识蒸馏

Wwwilling 2023-09-24 原文
  • 文献题目:CMKD: CNN/Transformer-Based Cross-Model
    Knowledge Distillation for Audio Classification
  • 文献时间:2022

摘要

  • 音频分类是一个活跃的研究领域,具有广泛的应用。 在过去十年中,卷积神经网络 (CNN) 已成为端到端音频分类模型的事实上的标准构建块。 最近,仅基于自注意力机制(如音频频谱图Transformer (AST))的神经网络已被证明优于 CNN。 在本文中,我们发现了两个非常不同的模型之间的有趣交互——CNN 和 AST 模型是彼此的好老师。 当我们使用其中任何一个作为教师并通过知识蒸馏(KD)将另一个模型训练为学生时,学生模型的性能显着提高,并且在许多情况下优于教师模型。 在我们使用这种 CNN/Transformer 跨模型知识蒸馏 (CMKD) 方法的实验中,我们在 FSD50K、AudioSet 和 ESC-50 上实现了新的最先进的性能

引言

  • 音频分类旨在识别给定音频记录中发生的声音事件,并使各种基于人工智能的系统能够消除声音的歧义并了解声学环境。历史上,手工制作的特征和隐马尔可夫模型(HMM)被用于音频分类[1]、[2]、[3]。随着过去十年神经网络的兴起,卷积神经网络 (CNN) [4] 已成为端到端音频分类模型的事实上的标准构建块,旨在学习直接映射从音频波形或频谱图到相应的标签 [5]、[6]、[7]、[8]、[9]、[10]。最近,纯粹基于自注意力的神经网络,例如音频频谱图转换器 (AST) [11]、[12]、[13],已被证明在各种音频上进一步优于使用卷积神经网络构建的深度学习模型分类任务,从而将 Transformers 的成功从自然语言处理 [14]、[15] 和计算机视觉 [16]、[17] 扩展到音频领域。
  • CNN 和 Transformer 模型都有各自的优势。 例如,CNN 模型具有一些内置的归纳偏差,例如空间局部性和平移等效性,使其非常适合基于频谱图的端到端音频分类。 Transformer 模型没有这种内置的归纳偏差,并且以更加数据驱动的方式学习,使其更加灵活。 因此,CNN 和 Transformer 模型学习的表示明显不同 [18]。 另一方面,虽然 Transformer 模型表现更好,但由于其 O ( n 2 ) O(n^2) O(n2) 复杂度,它们在长音频输入上的计算效率低于 CNN 模型。
  • 在本文中,我们展示了两个非常不同的模型之间的有趣交互——CNN 和 AST 模型是彼此的好老师。当我们使用一个模型作为教师并通过知识蒸馏(KD)训练另一个模型作为学生时,学生模型的性能明显提高,并且在大多数情况下优于教师模型。我们将 CNN 和 Transformer 模型之间的这种知识蒸馏框架称为跨模型知识蒸馏(CMKD)。跨模型知识蒸馏的成功并非微不足道,因为
  1. 跨模型知识蒸馏在 CNN→Transformer 和 Transformer→CNN 两个方向上双向工作。通常在 KD 中,老师需要比学生更强,但是对于跨模型的知识蒸馏,弱的老师仍然可以提高学生的表现。
    2)对于两个方向,学生在知识蒸馏后都优于老师,即使老师本来就更强大。
    3)同一类的两个模型之间的KD导致性能提升小得多或没有提升。因此,通过提出的跨模型知识蒸馏,具有均值池的简单 EfficientNet KD-CNN 模型在 FSD50K 和 ESC50 数据集上优于更大的 AST 模型。相反,KD-AST 模型在 FSD50K、AudioSet 和 ESC50 数据集上实现了最新的性能。
  • 本文的贡献有三个:第一,据我们所知,我们是第一个探索 CNN 和 Transformer 模型之间的双向知识蒸馏的人;之前的努力 [17]、[19] 仅研究 CNN→Transformer 方向,并在视觉领域进行。其次,我们对标准音频分类数据集进行了广泛的实验,并找到了最佳的知识蒸馏设置。此外,我们进行了一系列探测测试和消融研究,以探索跨模型知识蒸馏的工作机制。第三,由于提出的跨模型 KD 框架,小型高效的 CNN 模型匹配或优于以前的最先进模型; AST 模型在 FSD50K、AudioSet 和 ESC50 上实现了更好的性能并取得了新的最先进的结果。我们还在各种 CNN、CNN-attention 和 Transformer 模型上评估 CMKD,发现它提高了所有这些模型的性能,表明 CMKD 是一种通用方法——所有类型的模型都可以从 CMKD 中受益。

跨模型知识蒸馏

有关【Transformer论文】CMKD:用于音频分类的基于 CNN/Transformer 的跨模型知识蒸馏的更多相关文章

  1. ruby-on-rails - Rails - 子类化模型的设计模式是什么? - 2

    我有一个模型:classItem项目有一个属性“商店”基于存储的值,我希望Item对象对特定方法具有不同的行为。Rails中是否有针对此的通用设计模式?如果方法中没有大的if-else语句,这是如何干净利落地完成的? 最佳答案 通常通过Single-TableInheritance. 关于ruby-on-rails-Rails-子类化模型的设计模式是什么?,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.co

  2. ruby-on-rails - Rails 常用字符串(用于通知和错误信息等) - 2

    大约一年前,我决定确保每个包含非唯一文本的Flash通知都将从模块中的方法中获取文本。我这样做的最初原因是为了避免一遍又一遍地输入相同的字符串。如果我想更改措辞,我可以在一个地方轻松完成,而且一遍又一遍地重复同一件事而出现拼写错误的可能性也会降低。我最终得到的是这样的:moduleMessagesdefformat_error_messages(errors)errors.map{|attribute,message|"Error:#{attribute.to_s.titleize}#{message}."}enddeferror_message_could_not_find(obje

  3. ruby-on-rails - Rails - 一个 View 中的多个模型 - 2

    我需要从一个View访问多个模型。以前,我的links_controller仅用于提供以不同方式排序的链接资源。现在我想包括一个部分(我假设)显示按分数排序的顶级用户(@users=User.all.sort_by(&:score))我知道我可以将此代码插入每个链接操作并从View访问它,但这似乎不是“ruby方式”,我将需要在不久的将来访问更多模型。这可能会变得很脏,是否有针对这种情况的任何技术?注意事项:我认为我的应用程序正朝着单一格式和动态页面内容的方向发展,本质上是一个典型的网络应用程序。我知道before_filter但考虑到我希望应用程序进入的方向,这似乎很麻烦。最终从任何

  4. ruby-on-rails - 在混合/模块中覆盖模型的属性访问器 - 2

    我有一个包含模块的模型。我想在模块中覆盖模型的访问器方法。例如:classBlah这显然行不通。有什么想法可以实现吗? 最佳答案 您的代码看起来是正确的。我们正在毫无困难地使用这个确切的模式。如果我没记错的话,Rails使用#method_missing作为属性setter,因此您的模块将优先,阻止ActiveRecord的setter。如果您正在使用ActiveSupport::Concern(参见thisblogpost),那么您的实例方法需要进入一个特殊的模块:classBlah

  5. ruby-on-rails - 如何验证非模型(甚至非对象)字段 - 2

    我有一个表单,其中有很多字段取自数组(而不是模型或对象)。我如何验证这些字段的存在?solve_problem_pathdo|f|%>... 最佳答案 创建一个简单的类来包装请求参数并使用ActiveModel::Validations。#definedsomewhere,atthesimplest:require'ostruct'classSolvetrue#youcouldevencheckthesolutionwithavalidatorvalidatedoerrors.add(:base,"WRONG!!!")unlesss

  6. ruby-on-rails - form_for 中不在模型中的自定义字段 - 2

    我想向我的Controller传递一个参数,它是一个简单的复选框,但我不知道如何在模型的form_for中引入它,这是我的观点:{:id=>'go_finance'}do|f|%>Transferirde:para:Entrada:"input",:placeholder=>"Quantofoiganho?"%>Saída:"output",:placeholder=>"Quantofoigasto?"%>Nota:我想做一个额外的复选框,但我该怎么做,模型中没有一个对象,而是一个要检查的对象,以便在Controller中创建一个ifelse,如果没有检查,请帮助我,非常感谢,谢谢

  7. ruby-on-rails - 如何将验证与模型分开 - 2

    我有一些非常大的模型,我必须将它们迁移到最新版本的Rails。这些模型有相当多的验证(User有大约50个验证)。是否可以将所有这些验证移动到另一个文件中?说app/models/validations/user_validations.rb。如果可以,有人可以提供示例吗? 最佳答案 您可以为此使用关注点:#app/models/validations/user_validations.rbrequire'active_support/concern'moduleUserValidationsextendActiveSupport:

  8. Ruby Sinatra 配置用于生产和开发 - 2

    我已经在Sinatra上创建了应用程序,它代表了一个简单的API。我想在生产和开发上进行部署。我想在部署时选择,是开发还是生产,一些方法的逻辑应该改变,这取决于部署类型。是否有任何想法,如何完成以及解决此问题的一些示例。例子:我有代码get'/api/test'doreturn"Itisdev"end但是在部署到生产环境之后我想在运行/api/test之后看到ItisPROD如何实现? 最佳答案 根据SinatraDocumentation:EnvironmentscanbesetthroughtheRACK_ENVenvironm

  9. ruby-on-rails - Rails 模型——非持久类成员或属性? - 2

    对于Rails模型,是否可以/建议让一个类的成员不持久保存到数据库中?我想将用户最后选择的类型存储在session变量中。由于我无法从我的模型中设置session变量,我想将值存储在一个“虚拟”类成员中,该成员只是将值传递回Controller。你能有这样的类(class)成员吗? 最佳答案 将非持久属性添加到Rails模型就像任何其他Ruby类一样:classUser扩展解释:在Ruby中,所有实例变量都是私有(private)的,不需要在赋值前定义。attr_accessor创建一个setter和getter方法:classUs

  10. ruby-on-rails - Rails - 从另一个模型中创建一个模型的实例 - 2

    我有一个正在构建的应用程序,我需要一个模型来创建另一个模型的实例。我希望每辆车都有4个轮胎。汽车模型classCar轮胎模型classTire但是,在make_tires内部有一个错误,如果我为Tire尝试它,则没有用于创建或新建的activerecord方法。当我检查轮胎时,它没有这些方法。我该如何补救?错误是这样的:未定义的方法'create'forActiveRecord::AttributeMethods::Serialization::Tire::Module我测试了两个环境:测试和开发,它们都因相同的错误而失败。 最佳答案

随机推荐