草庐IT

白细胞

全部标签

单细胞细胞比例分析方法列举

1.利用箱线图比较两类样本的某个细胞比例差异比较直观,但是缺点在于如果单细胞样本个数过少且异质性大,导致很难有统计学显著意义library(ggpubr)data2.Ro/e比值好多文章都有用这个,我的理解是四格表卡方检验计算出来的观测除以期望Cell_typeCancerNormalTcell80200Bcell100120Tam200100例如上述数据,一开始有三类细胞,分别在癌和正常的个数如表所示,那么计算Ro/e的时候就要构建四格表,以T细胞为例Cell_typeCancerNormalTcell80200Others300220##计算卡方值以及期望和观测值x##[,1][,2]##

单细胞细胞比例分析方法列举

1.利用箱线图比较两类样本的某个细胞比例差异比较直观,但是缺点在于如果单细胞样本个数过少且异质性大,导致很难有统计学显著意义library(ggpubr)data2.Ro/e比值好多文章都有用这个,我的理解是四格表卡方检验计算出来的观测除以期望Cell_typeCancerNormalTcell80200Bcell100120Tam200100例如上述数据,一开始有三类细胞,分别在癌和正常的个数如表所示,那么计算Ro/e的时候就要构建四格表,以T细胞为例Cell_typeCancerNormalTcell80200Others300220##计算卡方值以及期望和观测值x##[,1][,2]##

单细胞/空间组利用scanpy实现Seurat的splitby分页绘图

在使用Seurat时,经常需要对不同分类的样本在同一画布上进行可视化,可以非常方便地通过其DimPlot()函数的goupyby和spliby等参数实现,例如对照组和实验组,如下:以正常和肿瘤组织作为区别但是在python的环境中,scanpy的sc.pl.umap()并没有这么灵活的参数。所以需要通过循环解决问题,sc.pl.umap中的color参数类似于Seurat的groupby,但其groups参数完全没有Seurat的splitby强大。所以我们可以通过python的Matplotlib包的plt.subplots()函数,结合循环将分组内容一一绘制,再多个分组图合并在一起,就实现

基于Scanpy AnnData的细胞自动注释:SCCAF

对SCCAF的基本介绍单细胞聚类评估框架(Single-CellClusteringAssessmentFramework,SCCAF)原文尽管有多种基于参考数据集的自动化注释工具(SingleR、CHETAH、ACTINN、scClassify等),它们通常难以发现新的细胞类型。基于上述问题,作者提出了一种基于python的自动化方法——SCCAF,用以辅助发现新的、尚未被注释的细胞类型。SCCAF基于机器学习和自映射对聚类的迭代,先从一个“过度聚类”的细胞聚类开始,逐步合并被机器学习认为是相同细胞的细胞簇。最终,得到一个能被机器学习很好区分的聚类结果,机器学习学到的每种细胞中的特征基因就是

单细胞/空间组利用scanpy实现Seurat的splitby分页绘图

在使用Seurat时,经常需要对不同分类的样本在同一画布上进行可视化,可以非常方便地通过其DimPlot()函数的goupyby和spliby等参数实现,例如对照组和实验组,如下:以正常和肿瘤组织作为区别但是在python的环境中,scanpy的sc.pl.umap()并没有这么灵活的参数。所以需要通过循环解决问题,sc.pl.umap中的color参数类似于Seurat的groupby,但其groups参数完全没有Seurat的splitby强大。所以我们可以通过python的Matplotlib包的plt.subplots()函数,结合循环将分组内容一一绘制,再多个分组图合并在一起,就实现

基于Scanpy AnnData的细胞自动注释:SCCAF

对SCCAF的基本介绍单细胞聚类评估框架(Single-CellClusteringAssessmentFramework,SCCAF)原文尽管有多种基于参考数据集的自动化注释工具(SingleR、CHETAH、ACTINN、scClassify等),它们通常难以发现新的细胞类型。基于上述问题,作者提出了一种基于python的自动化方法——SCCAF,用以辅助发现新的、尚未被注释的细胞类型。SCCAF基于机器学习和自映射对聚类的迭代,先从一个“过度聚类”的细胞聚类开始,逐步合并被机器学习认为是相同细胞的细胞簇。最终,得到一个能被机器学习很好区分的聚类结果,机器学习学到的每种细胞中的特征基因就是

单细胞测序分析之PCA后维度的选择

关于“数据的维度”(dims参数)的选择完成PCA之后,我们获得了该数据集的所有主成分(PCs)信息,但是如何决定纳入多少个主成分进行下游分析呢?主要参考以下方法:热图DimHeatmap(pbmc,dims=1:15,cells=500,balanced=TRUE)image.png如上图所示,可以看出前15个主成分可以把细胞分成差异明显的两群,说明前15个主成分中含有的显著的差异基因更多,主成分也就更有意义,所以下游分析可以纳入前15个PCs。碎石图ElbowplotElbowPlot(pbmc)通过碎石图可以看出每个PC对变异的贡献情况,从上图可以看出9~10PC以后逐渐趋于稳定(噪声主

单细胞测序分析之PCA后维度的选择

关于“数据的维度”(dims参数)的选择完成PCA之后,我们获得了该数据集的所有主成分(PCs)信息,但是如何决定纳入多少个主成分进行下游分析呢?主要参考以下方法:热图DimHeatmap(pbmc,dims=1:15,cells=500,balanced=TRUE)image.png如上图所示,可以看出前15个主成分可以把细胞分成差异明显的两群,说明前15个主成分中含有的显著的差异基因更多,主成分也就更有意义,所以下游分析可以纳入前15个PCs。碎石图ElbowplotElbowPlot(pbmc)通过碎石图可以看出每个PC对变异的贡献情况,从上图可以看出9~10PC以后逐渐趋于稳定(噪声主

单细胞测序之差异表达基因获得方法

1.加载数据library(Seurat)library(SeuratData)pbmcpbmcAnobjectofclassSeurat13714featuresacross2638sampleswithin1assayActiveassay:RNA(13714features,2000variablefeatures)2dimensionalreductionscalculated:pca,umap2.执行默认的差异表达测试Seurat的大部分差异表达特征可以通过“FindMarkers()”函数访问。默认情况下,Seurat基于非参数Wilcoxon秩和检验执行差分表达式。这取代了以前的

单细胞测序之差异表达基因获得方法

1.加载数据library(Seurat)library(SeuratData)pbmcpbmcAnobjectofclassSeurat13714featuresacross2638sampleswithin1assayActiveassay:RNA(13714features,2000variablefeatures)2dimensionalreductionscalculated:pca,umap2.执行默认的差异表达测试Seurat的大部分差异表达特征可以通过“FindMarkers()”函数访问。默认情况下,Seurat基于非参数Wilcoxon秩和检验执行差分表达式。这取代了以前的