草庐IT

codeTable

全部标签

【网安AIGC专题10.11】论文1:生成式模型GPT\CodeX填充式模型CodeT5\INCODER+大模型自动程序修复(生成整个修复函数、修复代码填充、单行代码生产、生成的修复代码排序和过滤)

论文1:AutomatedProgramRepairintheEraofLargePre-trainedLanguageModels写在最前面论文总结背景知识介绍语言模型双向语言模型单向语言模型自动程序修复(APR)技术发展论文概述模型选择方法生成整个修复函数修复代码填充单行代码生产生成的修复代码排序和过滤实验实验数据集实验结果对比写在最前面本文为邹德清教授的《网络安全专题》课堂笔记系列的文章,本次专题主题为大模型。10.11分享论文1:AutomatedProgramRepairintheEraofLargePre-trainedLanguageModels《llm在程序修复中的应用》马兴宇

论文笔记 CodeT5

文章的全名叫做CodeT5:Identifier-awareUnifiedPre-trainedEncoder-DecoderModelsforCodeUnderstandingandGenerstion。原文链接论文StrucCoder给出了一个概念叫做Struct-aware,译过来就是结构感知能力,意思就是在训练的时候给模型的各个模块如embedding、attention、tasks等等中加入能够和代码结构相关的信息,这样模型就能够很好地区别于普通的Seqtoseq模型从而学到比较好的代码表征。目前在处理代码翻译代码生成的任务上具有结构感知能力的表现优秀的模型有GraphCodeBer