文章的全名叫做CodeT5:Identifier-awareUnifiedPre-trainedEncoder-DecoderModelsforCodeUnderstandingandGenerstion。原文链接论文StrucCoder给出了一个概念叫做Struct-aware,译过来就是结构感知能力,意思就是在训练的时候给模型的各个模块如embedding、attention、tasks等等中加入能够和代码结构相关的信息,这样模型就能够很好地区别于普通的Seqtoseq模型从而学到比较好的代码表征。目前在处理代码翻译代码生成的任务上具有结构感知能力的表现优秀的模型有GraphCodeBer