草庐IT

SCENIC/pySCENIC分析补充+小鼠数据示例2022-12-14

适用背景之前写了两篇博客(四步完成单细胞数据调控网络流程分析-SCENIC/pySCENIC-2022-09-06和SCENIC/pySCENIC结果可视化2022-11-08)介绍SCENIC/pySCENIC的使用,最近在使用的时候遇到一些问题,因此这篇文章作为补充,如果看不懂本篇可以查看前两篇博客。补充内容主要有以下几点:1、小鼠的数据库构建2、从四步流程缩减到三步3、环境构建遇到的一些errors4、SCENIC版本的bugs小鼠的数据库构建之前的博客构建的是人的数据库,但博主最近分析需要用到小鼠的,因此需要构建一下新的数据库。正如之前博客写到的,其实构建这个数据库只需要替换3个文件,

R语言biomart包获取小鼠的基因长度

接上回的故事,公司给了新一批的数据,但是批次效应比较重,需要去批次。去批次之后,fpkm出现了负值,但是counts在很多分析里不能直接用,所以需要counts转fpkm。目前网上关于人类基因组的已经比较多了,但是小鼠的我没咋找到,特别是biomart这个包我用的不熟练,绕了很多弯路,有点挠头。于是有了今天的文章,如何获取小鼠的基因长度。rm(list=ls())一键清空工作空间。listMarts()这个函数能够返回bioMRT可以连接的数据库列表,就是看看哪些数据库是能用的mart=useMart('ensembl')head(listDatasets(mart))dataset通过use