草庐IT

14.GO富集分析R语言代码及5种图的绘制

NiKasu 2023-10-16 原文

一、举例回顾

本节使用GSE1009数据集,已经用limma包对数据集中的样本进行差异分析,现对差异基因(DEGs)做GO富集分析。

GSE1009数据集介绍:  

样本量:共6个样本,其中后3为糖尿病肾病(DN)肾小球样本,前3个为正常肾小球样本。

使用芯片:Affymetrix Human Genome U95 Version 2 Array。

平台:GPL8300。

DEGs:共有66个DEGs(diffsig),22个上调(diffup),44个下调(diffDown)(详见上两章).

二、需要准备的文件:

包含差异基因名字+logFC值的文本文件,命名为symbol(下面有介绍详细做法。)

三、具体做法:

1. 整理symbol文件

在上一节中diffSig变量,用write.table函数保存为包含差异基因名字+logFC值等的文件,命名为diff。


将diffSig变量保存哦


保存的方法如上,如果上次已经保存了的,直接调用





保存好diff文件,是下面这样的:


保存好的diff文件



手动给基因名加上列名,为gene,如下:


加上第一列名gene



重点:新建一个文本文件,取名为symbol,将第一列gene和第二列logFC复制symbol.

symbol


2.ID转换(将基因名转换为entrezID

setwd("D:\\Rfile")

rm(list = ls())

options(stringsAsFactors=F)

#老规矩,先设置工作目录。



library("clusterProfiler")

library("org.Hs.eg.db")

library("enrichplot")

library("ggplot2")

#加载这些包,加载之前记得先安装,已经安装过的复制代码直接调用。



rt=read.table("symbol.txt",sep="\t",check.names=F,header=T)    

#读取symbol文件,并赋值给rt


genes=as.vector(rt[,1])

#取rt的第一列,即基因名字,将其转换为向量,并赋值给genes变量


entrezIDs <- mget(genes, org.Hs.egSYMBOL2EG, ifnotfound=NA)    

#找出基因对应的id,未找到的赋值为NA



entrezIDs <- as.character(entrezIDs)

out=cbind(rt,entrezID=entrezIDs)

#将基因ID转换为entrezIDs



write.table(out,file="id.txt",sep="\t",quote=F,row.names=F)    #输出结果,结果为id文本文档


3.GO分析及绘图

##读取ID转换后文件

rt=read.table("id.txt",sep="\t",header=T,check.names=F)           #读取id.txt文件

rt=rt[is.na(rt[,"entrezID"])==F,]                               #去除基因id为NA的基因

gene=rt$entrezID   #取entrezID赋值给gene变量




##GO分析

#GO富集分析

kk <- enrichGO(gene = gene,

               OrgDb = org.Hs.eg.db,

               pvalueCutoff =0.05,

               qvalueCutoff = 0.05,

               ont="all",

               readable =T)

#p值和q值可以自己设置,我们这里都设置成0.05。这一步需要一点时间,耐心等待。


write.table(kk,file="GO.txt",sep="\t",quote=F,row.names = F)               

#保存GO富集结果



#1.GO柱状图

pdf(file="GO柱状图.pdf",width = 10,height = 8)

barplot(kk, drop = TRUE, showCategory =10,split="ONTOLOGY") + facet_grid(ONTOLOGY~., scale='free')

dev.off()

#pdf格式


png(file="GO柱状图.png",width = 800,height = 1000)

barplot(kk, drop = TRUE, showCategory =10,split="ONTOLOGY") + facet_grid(ONTOLOGY~., scale='free')

dev.off()

#保存为png格式,图片保存格式只举例这次,后面一样的道理,也可以保存为tiff格式等




#2.GO点图

pdf(file="GO点图.pdf",width = 10,height = 8)

dotplot(kk,showCategory = 10,split="ONTOLOGY") + facet_grid(ONTOLOGY~., scale='free')

dev.off()



##3.GO浮动气泡图

library(GOplot)

ego=read.table("GO.txt", header = T,sep="\t",check.names=F)           

#读取GO富集结果文件



go=data.frame(Category = ego$ONTOLOGY,ID = ego$ID,Term = ego$Description, Genes = gsub("/", ", ", ego$geneID), adj_pval = ego$p.adjust)


#读取基因的logFC文件

id.fc <- read.table("id.txt", header = T,sep="\t",check.names=F)

genelist <- data.frame(ID = id.fc$gene, logFC = id.fc$logFC)

row.names(genelist)=genelist[,1]

circ <- circle_dat(go, genelist)


#绘制GO浮动气泡图

pdf(file="GO气泡图.pdf",width = 10,height = 8)

GOBubble(circ, labels = 3,table.legend =F)

dev.off()



#4.绘制GO圆圈图

pdf(file="GO圈图.pdf",width = 14,height = 6)

GOCircle(circ,rad1=2.5,rad2=3.5,label.size=4,nsub=10)           

#rad1外圈的注释;nsub=10中10代表显示GO的数据,可修改

dev.off()



#5.绘制GO热图

termNum = 20                                     #限定term数目

geneNum = nrow(genelist)                         #限定基因数目

chord <- chord_dat(circ, genelist[1:geneNum,], go$Term[1:termNum])

pdf(file="GO热图.pdf",width = 11,height = 5)

GOHeat(chord, nlfc =1, fill.col = c('red', 'white', 'blue'))

dev.off()



GO分析和GO的几种图就完了,大家可根据自身情况选择一种图,下一章是KEGG分析和绘图。

有关14.GO富集分析R语言代码及5种图的绘制的更多相关文章

  1. ruby - 如何将脚本文件的末尾读取为数据文件(Perl 或任何其他语言) - 2

    我正在寻找执行以下操作的正确语法(在Perl、Shell或Ruby中):#variabletoaccessthedatalinesappendedasafileEND_OF_SCRIPT_MARKERrawdatastartshereanditcontinues. 最佳答案 Perl用__DATA__做这个:#!/usr/bin/perlusestrict;usewarnings;while(){print;}__DATA__Texttoprintgoeshere 关于ruby-如何将脚

  2. ruby - 如何在 buildr 项目中使用 Ruby 代码? - 2

    如何在buildr项目中使用Ruby?我在很多不同的项目中使用过Ruby、JRuby、Java和Clojure。我目前正在使用我的标准Ruby开发一个模拟应用程序,我想尝试使用Clojure后端(我确实喜欢功能代码)以及JRubygui和测试套件。我还可以看到在未来的不同项目中使用Scala作为后端。我想我要为我的项目尝试一下buildr(http://buildr.apache.org/),但我注意到buildr似乎没有设置为在项目中使用JRuby代码本身!这看起来有点傻,因为该工具旨在统一通用的JVM语言并且是在ruby中构建的。除了将输出的jar包含在一个独特的、仅限ruby​​

  3. ruby-on-rails - Rails 源代码 : initialize hash in a weird way? - 2

    在rails源中:https://github.com/rails/rails/blob/master/activesupport/lib/active_support/lazy_load_hooks.rb可以看到以下内容@load_hooks=Hash.new{|h,k|h[k]=[]}在IRB中,它只是初始化一个空哈希。和做有什么区别@load_hooks=Hash.new 最佳答案 查看rubydocumentationforHashnew→new_hashclicktotogglesourcenew(obj)→new_has

  4. ruby-on-rails - 浏览 Ruby 源代码 - 2

    我的主要目标是能够完全理解我正在使用的库/gem。我尝试在Github上从头到尾阅读源代码,但这真的很难。我认为更有趣、更温和的踏脚石就是在使用时阅读每个库/gem方法的源代码。例如,我想知道RubyonRails中的redirect_to方法是如何工作的:如何查找redirect_to方法的源代码?我知道在pry中我可以执行类似show-methodmethod的操作,但我如何才能对Rails框架中的方法执行此操作?您对我如何更好地理解Gem及其API有什么建议吗?仅仅阅读源代码似乎真的很难,尤其是对于框架。谢谢! 最佳答案 Ru

  5. ruby - 模块嵌套代码风格偏好 - 2

    我的假设是moduleAmoduleBendend和moduleA::Bend是一样的。我能够从thisblog找到解决方案,thisSOthread和andthisSOthread.为什么以及什么时候应该更喜欢紧凑语法A::B而不是另一个,因为它显然有一个缺点?我有一种直觉,它可能与性能有关,因为在更多命名空间中查找常量需要更多计算。但是我无法通过对普通类进行基准测试来验证这一点。 最佳答案 这两种写作方法经常被混淆。首先要说的是,据我所知,没有可衡量的性能差异。(在下面的书面示例中不断查找)最明显的区别,可能也是最著名的,是你的

  6. ruby - 寻找通过阅读代码确定编程语言的ruby gem? - 2

    几个月前,我读了一篇关于ruby​​gem的博客文章,它可以通过阅读代码本身来确定编程语言。对于我的生活,我不记得博客或gem的名称。谷歌搜索“ruby编程语言猜测”及其变体也无济于事。有人碰巧知道相关gem的名称吗? 最佳答案 是这个吗:http://github.com/chrislo/sourceclassifier/tree/master 关于ruby-寻找通过阅读代码确定编程语言的rubygem?,我们在StackOverflow上找到一个类似的问题:

  7. ruby - Net::HTTP 获取源代码和状态 - 2

    我目前正在使用以下方法获取页面的源代码:Net::HTTP.get(URI.parse(page.url))我还想获取HTTP状态,而无需发出第二个请求。有没有办法用另一种方法做到这一点?我一直在查看文档,但似乎找不到我要找的东西。 最佳答案 在我看来,除非您需要一些真正的低级访问或控制,否则最好使用Ruby的内置Open::URI模块:require'open-uri'io=open('http://www.example.org/')#=>#body=io.read[0,50]#=>"["200","OK"]io.base_ur

  8. 程序员如何提高代码能力? - 2

    前言作为一名程序员,自己的本质工作就是做程序开发,那么程序开发的时候最直接的体现就是代码,检验一个程序员技术水平的一个核心环节就是开发时候的代码能力。众所周知,程序开发的水平提升是一个循序渐进的过程,每一位程序员都是从“菜鸟”变成“大神”的,所以程序员在程序开发过程中的代码能力也是根据平时开发中的业务实践来积累和提升的。提高代码能力核心要素程序员要想提高自身代码能力,尤其是新晋程序员的代码能力有很大的提升空间的时候,需要针对性的去提高自己的代码能力。提高代码能力其实有几个比较关键的点,只要把握住这些方面,就能很好的、快速的提高自己的一部分代码能力。1、多去阅读开源项目,如有机会可以亲自参与开源

  9. Unity 热更新技术 | (三) Lua语言基本介绍及下载安装 - 2

    ?博客主页:https://xiaoy.blog.csdn.net?本文由呆呆敲代码的小Y原创,首发于CSDN??学习专栏推荐:Unity系统学习专栏?游戏制作专栏推荐:游戏制作?Unity实战100例专栏推荐:Unity实战100例教程?欢迎点赞?收藏⭐留言?如有错误敬请指正!?未来很长,值得我们全力奔赴更美好的生活✨------------------❤️分割线❤️-------------------------

  10. 7个大一C语言必学的程序 / C语言经典代码大全 - 2

    嗨~大家好,这里是可莉!今天给大家带来的是7个C语言的经典基础代码~那一起往下看下去把【程序一】打印100到200之间的素数#includeintmain(){ inti; for(i=100;i 【程序二】输出乘法口诀表#includeintmain(){inti;for(i=1;i 【程序三】判断1000年---2000年之间的闰年#includeintmain(){intyear;for(year=1000;year 【程序四】给定两个整形变量的值,将两个值的内容进行交换。这里提供两种方法来进行交换,第一种为创建临时变量来进行交换,第二种是不创建临时变量而直接进行交换。1.创建临时变量来

随机推荐