草庐IT

RNA-seq分析流程二:DEseq2做不同组间差异表达分析

使用DEseq2循环做多组间差异表达分析    当有多组RNA-seq数据时,有时需要对多个组合进行差异表达分析,例如当我有CIM0/CIM7/CIM14/CIM28四组时,我需要得到每个组合间的差异表达情况,CIM7:CIM0;CIM14:CIM0;CIM14:CIM7等。使用ANOVA的方式也可以进行多组间比较,但由于ANOVA是指定同一个CK,并且不能得到具体是哪组相对于CK有差异表达,不能精准的解决我的需求,因此选择使用DEseq2循环对不同组进行差异表达分析。一.R脚本  目前脚本中DEGs(差异表达基因)筛选标准为log2FoldChange>1或log2FoldChange###

Hisat2+FeatureCounts+DESeq2流程+作图!

featureCounts是一个用来统计count数的软件,运行的速度飞快,比之前用的htseq-count快了好多好多。照例先说一下怎么下载这个软件:wgethttps://jaist.dl.sourceforge.net/project/subread/subread-1.6.2/subread-1.6.2-Linux-x86_64.tar.gztar-zxvfsubread-1.6.2-Linux-x86_64.tar.gzcdsubread-1.6.2-Linux-x86_64/bin./featureCounts-h然后来说这次的流程。照旧用Hisat2来比对出Bam文件之后。使用f

「用一个更复杂的例子,来深入学习DESeq2差异表达分析后的小分析」

这篇文章,对GriffithLab的DESeq2分析流程做一个解读。理解数据GriffithLab所使用的基因表达量矩阵总共包含了54个sample,这些sample可以划分为1)normal,2)primarytumor以及3)colorectalcancermetastaticintheliver从差异分析之后开始获取差异表达分析的结果在使用DESeq()函数完成差异表达分析之后(此处还是DESeq对象),获取其分析结果,需要用到函数results()。同时,想要提取对应组合差异表达分析的结果,需要用到contrast=c()参数,Note:contrast()的输入为3个字符串向量,1)

DEseq2 差异分析基本原理

DEseq简介寻找组间显著表达变化的基因,以解释基因表达水平的变化对生物功能的变化最直接的办法就行进行转录组测序和定量。那如何从不同组定量的转录组寻找到那些显著差异的基因呢?DESeq就是来解决这个问题的,它主要使用负二项分布的模型来进行差异分析。DESeq2是DEseq的升级版,但是DEseq2只适用于有生物学重复的试验,而DEseq既可以做有生物学重复也可以做无重复(或部分重复的)试验。2.DEseq2的差异分析原理2.1统计模型:负二项分布所谓的差异分析实际上是指通过假设检验来判断两组数据是否存在显著差异,有参数检验(总体分布已知)和非参数检验(总体分布未知)两种方式,显然,对于分布已知