草庐IT

【单细胞高级绘图】07.KEGG富集结果展示

这一节画的图是比较新的,图中我用红色箭头标出的是pathway一级注释信息(bigannotation,自己想的,非专有名词),纵轴花花绿绿的标注是pathway的二级注释(smallannotation)。如何获取注释算一个难点,我上一讲也已经讲过:KEGG通路的从属/注释信息如何获取。整个图反映的是有多少基因落到了对应的分类里面。辩证地看,整张图都是pathway注释,没有具体的pathway名称,跟平常做的富集分析很不一样。把图里面的二级注释换成具体的pathway会更好。另外,这个图中横坐标是基因数,但我觉得在富集分析中这个数值并不重要(基因ratio比单个数值重要),我们可以换成p值

单细胞转录组上游分析实战

一、下载数据GSE111229:https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE111229只下载7个SRR进行学习;数据下载的话可以参考前面写的一篇笔记:RNA-seq入门(一)数据下载和格式转换1.png二、安装conda参考前面的笔记:conda下载及安装安装软件:condainstall-ysra-toolsmultiqcfastphisat2三、SRA转fastq文件ls*|whilereadid;do(nohupfastq-dump--gzip--split-3-O./${id}&);done四、质控ls*gz|xargs

单细胞转录组上游分析实战

一、下载数据GSE111229:https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE111229只下载7个SRR进行学习;数据下载的话可以参考前面写的一篇笔记:RNA-seq入门(一)数据下载和格式转换1.png二、安装conda参考前面的笔记:conda下载及安装安装软件:condainstall-ysra-toolsmultiqcfastphisat2三、SRA转fastq文件ls*|whilereadid;do(nohupfastq-dump--gzip--split-3-O./${id}&);done四、质控ls*gz|xargs

手把手教你做单细胞测序数据分析(七)—— 基因集富集分析

往期回顾B站中只有视频课程,代码部分整理在往期推送之中:手把手教你做单细胞测序数据分析(一)——绪论手把手教你做单细胞测序数据分析(二)——各类输入文件读取手把手教你做单细胞测序数据分析(三)——单样本分析手把手教你做单细胞测序数据分析(四)——多样本整合手把手教你做单细胞测序数据分析(五)——细胞类型注释手把手教你做单细胞测序数据分析(六)——组间差异分析及可视化其他单细胞相关技术贴也在这里:细胞的数量由誰决定?答读者问(三)单细胞测序前景答读者问(四):如何分析细胞亚群答读者问(六)、Seurat中如何让细胞听你指挥单细胞中应该如何做GSVA?如果这期视频看不懂,你可能需要看看这些:上一讲

手把手教你做单细胞测序数据分析(七)—— 基因集富集分析

往期回顾B站中只有视频课程,代码部分整理在往期推送之中:手把手教你做单细胞测序数据分析(一)——绪论手把手教你做单细胞测序数据分析(二)——各类输入文件读取手把手教你做单细胞测序数据分析(三)——单样本分析手把手教你做单细胞测序数据分析(四)——多样本整合手把手教你做单细胞测序数据分析(五)——细胞类型注释手把手教你做单细胞测序数据分析(六)——组间差异分析及可视化其他单细胞相关技术贴也在这里:细胞的数量由誰决定?答读者问(三)单细胞测序前景答读者问(四):如何分析细胞亚群答读者问(六)、Seurat中如何让细胞听你指挥单细胞中应该如何做GSVA?如果这期视频看不懂,你可能需要看看这些:上一讲

GEO单细胞测序数据下载

GEO数据库下载单细胞测序原始数据如果想要分析数据库中的数据,可以从文献中获得数据的GSE号,举个例子:image.png然后到NCBINationalCenterforBiotechnologyInformation(nih.gov)搜索GSE144024,就会得到如下信息:image.png其中,GSM号为样本编号,后面有详细信息。点击SRARUNSelector,就可以看到每个样本的SRR号。image.png选择想要下载的SRR,点击selected-accessionlist,就可得到一个编号的文本文件。但是呢想要下载,还得需要借助其他软件sratools。image.pngsrat

GEO单细胞测序数据下载

GEO数据库下载单细胞测序原始数据如果想要分析数据库中的数据,可以从文献中获得数据的GSE号,举个例子:image.png然后到NCBINationalCenterforBiotechnologyInformation(nih.gov)搜索GSE144024,就会得到如下信息:image.png其中,GSM号为样本编号,后面有详细信息。点击SRARUNSelector,就可以看到每个样本的SRR号。image.png选择想要下载的SRR,点击selected-accessionlist,就可得到一个编号的文本文件。但是呢想要下载,还得需要借助其他软件sratools。image.pngsrat

单细胞/空间组利用scanpy实现Seurat的splitby分页绘图

在使用Seurat时,经常需要对不同分类的样本在同一画布上进行可视化,可以非常方便地通过其DimPlot()函数的goupyby和spliby等参数实现,例如对照组和实验组,如下:以正常和肿瘤组织作为区别但是在python的环境中,scanpy的sc.pl.umap()并没有这么灵活的参数。所以需要通过循环解决问题,sc.pl.umap中的color参数类似于Seurat的groupby,但其groups参数完全没有Seurat的splitby强大。所以我们可以通过python的Matplotlib包的plt.subplots()函数,结合循环将分组内容一一绘制,再多个分组图合并在一起,就实现

单细胞/空间组利用scanpy实现Seurat的splitby分页绘图

在使用Seurat时,经常需要对不同分类的样本在同一画布上进行可视化,可以非常方便地通过其DimPlot()函数的goupyby和spliby等参数实现,例如对照组和实验组,如下:以正常和肿瘤组织作为区别但是在python的环境中,scanpy的sc.pl.umap()并没有这么灵活的参数。所以需要通过循环解决问题,sc.pl.umap中的color参数类似于Seurat的groupby,但其groups参数完全没有Seurat的splitby强大。所以我们可以通过python的Matplotlib包的plt.subplots()函数,结合循环将分组内容一一绘制,再多个分组图合并在一起,就实现

单细胞测序分析之PCA后维度的选择

关于“数据的维度”(dims参数)的选择完成PCA之后,我们获得了该数据集的所有主成分(PCs)信息,但是如何决定纳入多少个主成分进行下游分析呢?主要参考以下方法:热图DimHeatmap(pbmc,dims=1:15,cells=500,balanced=TRUE)image.png如上图所示,可以看出前15个主成分可以把细胞分成差异明显的两群,说明前15个主成分中含有的显著的差异基因更多,主成分也就更有意义,所以下游分析可以纳入前15个PCs。碎石图ElbowplotElbowPlot(pbmc)通过碎石图可以看出每个PC对变异的贡献情况,从上图可以看出9~10PC以后逐渐趋于稳定(噪声主