草庐IT

KEGG更新后富集分析的问题,包括下载包以及enrichKEGG和可视化

运行以下代码出现报错,探究原因:enrichKK出现以下报错:Errorinans[ypos]进行解决,查到第一个解决方法是把阈值降低,即将pvalueCutoff=0.01,qvalueCutoff=0.05,修改为:pvalueCutoff=0.2,qvalueCutoff=0.2,但是依旧有以上报错,不断尝试网上的方法依然有问题,发现还是clusterProfiler包的问题,昨天在进行clusterProfiler做KEGG富集分析时出现了错误,昨天发现是KEGG数据库的API更新了,在使用了很多大牛的方法,比如说Y叔的,但是还是报错,依旧显示-->Nogenecanbemapped.

【R语言clusterProfiler包】KEGG数据库更新,分析时报错如何解决

报错一-->Nogenecanbemapped....-->ExpectedinputgeneID:-->returnNULL...报错原因:在线查询KEGG数据库更新了,需要用新版本的R,更新clusterProfiler包R版本不对 R4.1报错二>ekk=enrichKEGG(gene=eg$ENTREZID,organism=organism,keyType="kegg",pAdjustMethod="none",pvalueCutoff=0.5,qvalueCutoff=1)ReadingKEGGannotationonline:"https://rest.kegg.jp/link/

2021.05.17【R语言】丨clusterProfiler注释表——KEGG/GO enrich富集图专用

摘要  刚开始接触项目的时候一直用公司搭建好的流程分析项目,慢慢学习后,发现有些地方的注释除了靠参考基因组相关的注释文档,还需要对应物种。在R中绘制KEGG.GOenrich富集图就需要根据物种来读取相应注释包,这里记录一份常用物种及对应注释包表,方便以后使用。注释表packagesorganismorg.Ag.eg.dbAnophelesorg.At.tair.dbArabidopsisorg.Bt.eg.dbBovineorg.Ce.eg.dbWormorg.Cf.eg.dbCanineorg.Dm.eg.dbFlyorg.Dr.eg.dbZebrafishorg.EcK12.eg.dbE

2021.05.17【R语言】丨clusterProfiler注释表——KEGG/GO enrich富集图专用

摘要  刚开始接触项目的时候一直用公司搭建好的流程分析项目,慢慢学习后,发现有些地方的注释除了靠参考基因组相关的注释文档,还需要对应物种。在R中绘制KEGG.GOenrich富集图就需要根据物种来读取相应注释包,这里记录一份常用物种及对应注释包表,方便以后使用。注释表packagesorganismorg.Ag.eg.dbAnophelesorg.At.tair.dbArabidopsisorg.Bt.eg.dbBovineorg.Ce.eg.dbWormorg.Cf.eg.dbCanineorg.Dm.eg.dbFlyorg.Dr.eg.dbZebrafishorg.EcK12.eg.dbE

展示DAVID富集分析结果中感兴趣的GO条目和KEGG通路

相信大家对GO和KEGG富集分析并不陌生,有时候富集分析会得到很多显著的结果。全部展示,版面不够。但是如果只展示前几个显著的GO条目或者KEGG通路的话,跟自己研究的对象相关的又不在里面。今天小编就来帮助大家解决这个尴尬的问题,把我们感兴趣的GO条目和KEGG通路挑出来,然后再来画图。有人可能要抬杠了,这不是伪造数据吗?NO,NO,NO,我们挑选出来展示的结果肯定也要是显著的。我们没有篡改任何数据,只是把“最美”的一面展示给大家。如果你一定要抬杠,我们也可以把完整结果放到附件里面。关于DAVID这个工具,小编前面也用了好几期的内容来给大家介绍。如何使用DAVID做GO和KEGG富集分析,并且给

【R语言】——基因GO/KEGG富集分析!超级简单的保姆级教程!

上期“干货预警——原来基因功能富集分析这么简单!”和“【R语言】——基因GO/KEGG功能富集结果可视化(保姆级教程)”介绍如何使用DAVID在线分析工具对基因进行GO/KEGG功能富集分析和使用Rggplot包对获得的基因GO/KEGG功能富集结果进行可视化。本期介绍使用RclusterProfiler包和RAnnotationHub包对基因进行GO/KEGG功能富集分析、OrgDb包制作以及结果可视化。GO/KEGG功能富集分析中重要的是背景基因的选择,使用RclusterProfiler包对基因进行富集,需要导入目的基因(前景基因)相对应物种的参考基因组(背景基因),现阶段“biocon

【R语言】——基因GO/KEGG富集分析!超级简单的保姆级教程!

上期“干货预警——原来基因功能富集分析这么简单!”和“【R语言】——基因GO/KEGG功能富集结果可视化(保姆级教程)”介绍如何使用DAVID在线分析工具对基因进行GO/KEGG功能富集分析和使用Rggplot包对获得的基因GO/KEGG功能富集结果进行可视化。本期介绍使用RclusterProfiler包和RAnnotationHub包对基因进行GO/KEGG功能富集分析、OrgDb包制作以及结果可视化。GO/KEGG功能富集分析中重要的是背景基因的选择,使用RclusterProfiler包对基因进行富集,需要导入目的基因(前景基因)相对应物种的参考基因组(背景基因),现阶段“biocon

【单细胞高级绘图】07.KEGG富集结果展示

这一节画的图是比较新的,图中我用红色箭头标出的是pathway一级注释信息(bigannotation,自己想的,非专有名词),纵轴花花绿绿的标注是pathway的二级注释(smallannotation)。如何获取注释算一个难点,我上一讲也已经讲过:KEGG通路的从属/注释信息如何获取。整个图反映的是有多少基因落到了对应的分类里面。辩证地看,整张图都是pathway注释,没有具体的pathway名称,跟平常做的富集分析很不一样。把图里面的二级注释换成具体的pathway会更好。另外,这个图中横坐标是基因数,但我觉得在富集分析中这个数值并不重要(基因ratio比单个数值重要),我们可以换成p值

【单细胞高级绘图】07.KEGG富集结果展示

这一节画的图是比较新的,图中我用红色箭头标出的是pathway一级注释信息(bigannotation,自己想的,非专有名词),纵轴花花绿绿的标注是pathway的二级注释(smallannotation)。如何获取注释算一个难点,我上一讲也已经讲过:KEGG通路的从属/注释信息如何获取。整个图反映的是有多少基因落到了对应的分类里面。辩证地看,整张图都是pathway注释,没有具体的pathway名称,跟平常做的富集分析很不一样。把图里面的二级注释换成具体的pathway会更好。另外,这个图中横坐标是基因数,但我觉得在富集分析中这个数值并不重要(基因ratio比单个数值重要),我们可以换成p值

非模式物种KEGG富集数据库准备(二)

一、KEGG数据下载1、先进入官网:https://www.kegg.jp/image.png2、进入KO(KEGGORTHOLOGY)Databaseimage.png3、点击此处选择物种image.png4、此处以斑马鱼为例,所以选择dreimage.png5、下载json文件到本地image.png二、json文件的处理importjsonimportreK_ko_dict={}withopen(json,"r")asf:K_ko_file_content=json.load(f)forchildren_infoinK_ko_file_content.get("children"):fo