背景RNA,环境RNA,RNA污染,游离RNA
background mRNAs, ambient RNA, RNA contamination, cell free mRNAs
去除环境RNA污染是处理单细胞数据的可选项。环境RNA污染简单来说就是由于实验原因导致某些基因的转录本扩散到大多数细胞,使得部分基因在大多数细胞中均出现高表达的现象,从而影响我们对细胞类型的定义以及其它分析。
要不要去除环境RNA取决于是否数据集看起来是否干净,不同组织收到污染的基因也不太相同,例如在外周血中(PBMC)常见的是血细胞的污染,一般是HBB之类的基因,而在大脑中因为神经元比较多,可能会有兴奋性神经元或抑制性神经元的污染,可能是SLC17A7或GAD1等基因的污染。
例如下图中Slc17a7是小鼠的兴奋性神经元经典marker,在某些非神经元细胞中也高表达,是比较典型的环境RNA污染。因此,对原始矩阵进行校正很有必要。

SoupX是一款我们测试过比较好的能有效去除环境RNA的R包软件,使用起来也比较方便。其输入为2个矩阵,一个常规的有做过初步过滤的矩阵toc,也就是直接读入进行后续聚类等分析的矩阵,另一个则是完全没有做过任何过滤的矩阵tod,这个矩阵一般需要自行从bam文件中提取。其原理可以简述为利用全矩阵tod构建背景噪音,筛选出潜在的环境RNA污染,然后对分析矩阵toc进行校正,最终可以返回一个校正后的矩阵。
加载需要的包
library(SoupX)
library(Seurat)
library(DropletUtils)
主函数
##参数简介
#toc是分析矩阵,即有过滤的矩阵
#tod是全矩阵,即没有任何过滤的矩阵
#rho是污染比例系数,可自行设置,如果不设置则会自动计算
run_soupx <- function(toc,tod,rho=NULL) {
toc <- Read10X(toc,gene.column=1)
tod <- Read10X(tod,gene.column=1)
#保证基因名一致
tod <- tod[rownames(toc),]
##SoupX帮助文档建议提供分析矩阵的聚类亚群分组,因此这里利用分析矩阵做一个简单聚类
all <- toc
all <- CreateSeuratObject(all)
all <- NormalizeData(all, normalization.method = "LogNormalize", scale.factor = 10000)
all <- FindVariableFeatures(all, selection.method = "vst", nfeatures = 3000)
all.genes <- rownames(all)
all <- ScaleData(all, features = all.genes)
all <- RunPCA(all, features = VariableFeatures(all), npcs = 40, verbose = F)
all <- FindNeighbors(all, dims = 1:30)
all <- FindClusters(all, resolution = 0.5)
all <- RunUMAP(all, dims = 1:30)
#提取聚类后的meta.data信息
matx <- all@meta.data
sc = SoupChannel(tod, toc)
sc = setClusters(sc, setNames(matx$seurat_clusters, rownames(matx)))
#自动计算污染比例系数
if (is.null(rho)) {
tryCatch(
{sc = autoEstCont(sc)},
error=function(e) {
#因为自动计算经常会报错,所以如果报错则设置rho为0.2
print("autoEstCont Error !")
sc = setContaminationFraction(sc, 0.2)}
)
}else{
#自行设置污染比例系数
sc = setContaminationFraction(sc, rho)
}
#校正矩阵
out = adjustCounts(sc)
#保存两个矩阵文件
saveRDS(sc,"sc.rds")
#保存校正后的矩阵,输出为10X格式
DropletUtils:::write10xCounts("./soupX_matrix", out,version="3")
}
根据官方文档,污染比例系数可以自动计算,也可以自行设置,一般设置为0.2即可去除99%的环境RNA污染。
Our experiments indicate that adding 5% extra removes 90-95% of the soup, 10% gets rid of 95-98% and 20% removes 99% or more.
直接调用函数
run_soupx(toc,tod)
还可以设置污染系数
run_soupx(toc,tod,rho=0.25)
之后如果要批量去除环境RNA可以用写个循环调用此函数。
虽然没有太大的差异,但是细看还是干净了不少,而且一般对矩阵尽量少处理是比较好的,这种轻微处理还是可以接受的。

运行SoupX不怎么耗内存,也不怎么耗时间,不过存在一个问题,就是校正后的表达矩阵数值不是整数了,都成小数了,这个一方面会增加存储,另一方面后续分析中也会比较耗运行内存,可以设置roundToInt=TRUE随机取整强行转成整数。不过,不建议这样做,因为还是尽量对分析矩阵少做处理。
另外,SoupX还可以自行设置污染比较严重的基因集,具体可以查看官方文档。
我在开发的Rails3网站的一些搜索功能上遇到了一个小问题。我有一个简单的Post模型,如下所示:classPost我正在使用acts_as_taggable_on来更轻松地向我的帖子添加标签。当我有一个标记为“rails”的帖子并执行以下操作时,一切正常:@posts=Post.tagged_with("rails")问题是,我还想搜索帖子的标题。当我有一篇标题为“Helloworld”并标记为“rails”的帖子时,我希望能够通过搜索“hello”或“rails”来找到这篇帖子。因此,我希望标题列的LIKE语句与acts_as_taggable_on提供的tagged_with方法
我正在玩HTML5视频并且在ERB中有以下片段:mp4视频从在我的开发环境中运行的服务器很好地流式传输到chrome。然而firefox显示带有海报图像的视频播放器,但带有一个大X。问题似乎是mongrel不确定ogv扩展的mime类型,并且只返回text/plain,如curl所示:$curl-Ihttp://0.0.0.0:3000/pr6.ogvHTTP/1.1200OKConnection:closeDate:Mon,19Apr201012:33:50GMTLast-Modified:Sun,18Apr201012:46:07GMTContent-Type:text/plain
之前在培训新生的时候,windows环境下配置opencv环境一直教的都是网上主流的vsstudio配置属性表,但是这个似乎对新生来说难度略高(虽然个人觉得完全是他们自己的问题),加之暑假之后对cmake实在是爱不释手,且这样配置确实十分简单(其实都不需要配置),故斗胆妄言vscode下配置CV之法。其实极为简单,图比较多所以很长。如果你看此文还配不好,你应该思考一下是不是自己的问题。闲话少说,直接开始。0.CMkae简介有的人到大二了都不知道cmake是什么,我不说是谁。CMake是一个开源免费并且跨平台的构建工具,可以用简单的语句来描述所有平台的编译过程。它能够根据当前所在平台输出对应的m
我试图在rails中了解rubygems是如何变得可以自动使用的,而不是在使用required的文件中gem? 最佳答案 这是通过bundler/setup完成的:http://bundler.io/v1.3/bundler_setup.html.它在您的config/boot.rb文件中是必需的。简而言之,它首先将环境变量设置为指向您的Gemfile:ENV['BUNDLE_GEMFILE']||=File.expand_path('../../Gemfile',__FILE__)然后它通过要求bundler/setup将所有ge
很难说出这里要问什么。这个问题模棱两可、含糊不清、不完整、过于宽泛或夸夸其谈,无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开,visitthehelpcenter.关闭9年前。我需要从基于ruby的应用程序使用AmazonSimpleNotificationService,但不知道从哪里开始。您对从哪里开始有什么建议吗?
从一开始,我就是一个Windows高手。我从MS-DOS开始。我安装了Windows2.1以及此后的所有Windows。现在,我家里有10台不同的Windows机器在运行,从Windows7Ultimate到各种版本的WindowsServer。我还没有完成Windows8,也不想去那里。我在服务器和各种软件方面都有UNIX经验,但它并不是我的首选环境。但是,我想我正在转换。我试图假装使用Cygwin和MSYS在Windows下运行UNIX。我的目的是搭建一个开发环境。两者都让我失望了。我花了比开发更多的时间来解决一系列技术问题。这是NotAcceptable。到目前为止,我的Ruby
如果特定语言环境中缺少翻译,如何配置i18n以使用en语言环境翻译?当前已插入翻译缺失消息。我正在使用RoR3.1。 最佳答案 找到相似的question这里是答案:#application.rb#railswillfallbacktoconfig.i18n.default_localetranslationconfig.i18n.fallbacks=true#railswillfallbacktoen,nomatterwhatissetasconfig.i18n.default_localeconfig.i18n.fallback
我给自己买了一个新的8gigUSBkey,我正在寻找一个合适的解决方案来拥有一个可移植RoR环境来学习。我在谷歌上搜索了一下,发现了一些可能性,但我很想听听一些现实生活中的经历和意见。谢谢! 最佳答案 我喜欢InstantRails,非常容易使用,无需安装程序,也不会修改您的系统环境。 关于ruby-on-rails-可移植RubyonRails环境,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/q
在我的双语Rails4应用程序中,我有一个像这样的LocalesController:classLocalesController用户可以通过此表单更改其语言环境:deflocale_switcherform_tagurl_for(:controller=>'locales',:action=>'change_locale'),:method=>'get',:id=>'locale_switcher'doselect_tag'set_locale',options_for_select(LANGUAGES,I18n.locale.to_s)end这有效。但是,目前用户无法通过URL更改
我在跑Fastlane(适用于iOS的持续构建工具)以执行用于解密文件的自定义shell脚本。这是命令。sh"./decrypt.shENV['ENCRYPTION_P12']"我想不出将环境变量传递给该脚本的方法。显然,如果我将密码硬编码到脚本中,它就可以正常工作。sh"./decrypt.shmypwd"有什么建议吗? 最佳答案 从直接Shell中扩展假设这里的sh是一个faSTLane命令,它以给定的参数作为脚本文本调用shell命令:#asafastlanedirectivesh'./decrypt.sh"$ENCRYPTI