白细胞_草庐IT

单细胞细胞比例分析方法列举

1.利用箱线图比较两类样本的某个细胞比例差异比较直观，但是缺点在于如果单细胞样本个数过少且异质性大，导致很难有统计学显著意义library(ggpubr)data2.Ro/e比值好多文章都有用这个，我的理解是四格表卡方检验计算出来的观测除以期望Cell_typeCancerNormalTcell80200Bcell100120Tam200100例如上述数据，一开始有三类细胞，分别在癌和正常的个数如表所示，那么计算Ro/e的时候就要构建四格表，以T细胞为例Cell_typeCancerNormalTcell80200Others300220##计算卡方值以及期望和观测值x##[,1][,2]##

单细胞列举 text-align align style

单细胞细胞比例分析方法列举

1.利用箱线图比较两类样本的某个细胞比例差异比较直观，但是缺点在于如果单细胞样本个数过少且异质性大，导致很难有统计学显著意义library(ggpubr)data2.Ro/e比值好多文章都有用这个，我的理解是四格表卡方检验计算出来的观测除以期望Cell_typeCancerNormalTcell80200Bcell100120Tam200100例如上述数据，一开始有三类细胞，分别在癌和正常的个数如表所示，那么计算Ro/e的时候就要构建四格表，以T细胞为例Cell_typeCancerNormalTcell80200Others300220##计算卡方值以及期望和观测值x##[,1][,2]##

单细胞列举 text-align align style

单细胞/空间组利用scanpy实现Seurat的splitby分页绘图

在使用Seurat时，经常需要对不同分类的样本在同一画布上进行可视化，可以非常方便地通过其DimPlot()函数的goupyby和spliby等参数实现，例如对照组和实验组，如下：以正常和肿瘤组织作为区别但是在python的环境中，scanpy的sc.pl.umap()并没有这么灵活的参数。所以需要通过循环解决问题，sc.pl.umap中的color参数类似于Seurat的groupby，但其groups参数完全没有Seurat的splitby强大。所以我们可以通过python的Matplotlib包的plt.subplots()函数，结合循环将分组内容一一绘制，再多个分组图合并在一起，就实现

单细胞 splitby section strong 适配

基于Scanpy AnnData的细胞自动注释：SCCAF

对SCCAF的基本介绍单细胞聚类评估框架（Single-CellClusteringAssessmentFramework,SCCAF）原文尽管有多种基于参考数据集的自动化注释工具（SingleR、CHETAH、ACTINN、scClassify等），它们通常难以发现新的细胞类型。基于上述问题，作者提出了一种基于python的自动化方法——SCCAF，用以辅助发现新的、尚未被注释的细胞类型。SCCAF基于机器学习和自映射对聚类的迭代，先从一个“过度聚类”的细胞聚类开始，逐步合并被机器学习认为是相同细胞的细胞簇。最终，得到一个能被机器学习很好区分的聚类结果，机器学习学到的每种细胞中的特征基因就是

AnnData Scanpy section https SCCAF

单细胞/空间组利用scanpy实现Seurat的splitby分页绘图

在使用Seurat时，经常需要对不同分类的样本在同一画布上进行可视化，可以非常方便地通过其DimPlot()函数的goupyby和spliby等参数实现，例如对照组和实验组，如下：以正常和肿瘤组织作为区别但是在python的环境中，scanpy的sc.pl.umap()并没有这么灵活的参数。所以需要通过循环解决问题，sc.pl.umap中的color参数类似于Seurat的groupby，但其groups参数完全没有Seurat的splitby强大。所以我们可以通过python的Matplotlib包的plt.subplots()函数，结合循环将分组内容一一绘制，再多个分组图合并在一起，就实现

单细胞 splitby section strong 适配

基于Scanpy AnnData的细胞自动注释：SCCAF

对SCCAF的基本介绍单细胞聚类评估框架（Single-CellClusteringAssessmentFramework,SCCAF）原文尽管有多种基于参考数据集的自动化注释工具（SingleR、CHETAH、ACTINN、scClassify等），它们通常难以发现新的细胞类型。基于上述问题，作者提出了一种基于python的自动化方法——SCCAF，用以辅助发现新的、尚未被注释的细胞类型。SCCAF基于机器学习和自映射对聚类的迭代，先从一个“过度聚类”的细胞聚类开始，逐步合并被机器学习认为是相同细胞的细胞簇。最终，得到一个能被机器学习很好区分的聚类结果，机器学习学到的每种细胞中的特征基因就是

AnnData Scanpy section https SCCAF

单细胞测序分析之PCA后维度的选择

关于“数据的维度”(dims参数)的选择完成PCA之后，我们获得了该数据集的所有主成分（PCs）信息，但是如何决定纳入多少个主成分进行下游分析呢？主要参考以下方法：热图DimHeatmap(pbmc,dims=1:15,cells=500,balanced=TRUE)image.png如上图所示，可以看出前15个主成分可以把细胞分成差异明显的两群，说明前15个主成分中含有的显著的差异基因更多，主成分也就更有意义，所以下游分析可以纳入前15个PCs。碎石图ElbowplotElbowPlot(pbmc)通过碎石图可以看出每个PC对变异的贡献情况，从上图可以看出9~10PC以后逐渐趋于稳定（噪声主

单细胞 PCA singlets code merge

单细胞测序分析之PCA后维度的选择

关于“数据的维度”(dims参数)的选择完成PCA之后，我们获得了该数据集的所有主成分（PCs）信息，但是如何决定纳入多少个主成分进行下游分析呢？主要参考以下方法：热图DimHeatmap(pbmc,dims=1:15,cells=500,balanced=TRUE)image.png如上图所示，可以看出前15个主成分可以把细胞分成差异明显的两群，说明前15个主成分中含有的显著的差异基因更多，主成分也就更有意义，所以下游分析可以纳入前15个PCs。碎石图ElbowplotElbowPlot(pbmc)通过碎石图可以看出每个PC对变异的贡献情况，从上图可以看出9~10PC以后逐渐趋于稳定（噪声主

单细胞 PCA singlets code merge

单细胞测序之差异表达基因获得方法

1.加载数据library(Seurat)library(SeuratData)pbmcpbmcAnobjectofclassSeurat13714featuresacross2638sampleswithin1assayActiveassay:RNA(13714features,2000variablefeatures)2dimensionalreductionscalculated:pca,umap2.执行默认的差异表达测试Seurat的大部分差异表达特征可以通过“FindMarkers()”函数访问。默认情况下，Seurat基于非参数Wilcoxon秩和检验执行差分表达式。这取代了以前的

单细胞基因 ident code Mono

单细胞测序之差异表达基因获得方法

1.加载数据library(Seurat)library(SeuratData)pbmcpbmcAnobjectofclassSeurat13714featuresacross2638sampleswithin1assayActiveassay:RNA(13714features,2000variablefeatures)2dimensionalreductionscalculated:pca,umap2.执行默认的差异表达测试Seurat的大部分差异表达特征可以通过“FindMarkers()”函数访问。默认情况下，Seurat基于非参数Wilcoxon秩和检验执行差分表达式。这取代了以前的

单细胞基因 ident code Mono