草庐IT

跟着Nature Communication学作图:R语言ggplot2话点线图展示基因表达量的范围

论文MicrobiomesintheChallengerDeepslopeandbottom-axissedimentshttps://www.nature.com/articles/s41467-022-29144-4#code-availability对应代码链接https://github.com/ucassee/Challenger-Deep-Microbes论文里提供了大部分图的数据和代码,很好的学习材料,感兴趣的同学可以找来参考,今天的推文重复一下论文中的Figure3b示例数据集部分截图image.png读取数据dat01作图代码library(ggplot2)library(s

跟着Nature Communication学数据分析:R语言利用宏基因组的相对丰度数据做主坐标分析(PcoA))

论文MicrobiomesintheChallengerDeepslopeandbottom-axissedimentshttps://www.nature.com/articles/s41467-022-29144-4#code-availability对应代码链接https://github.com/ucassee/Challenger-Deep-Microbes论文里提供了大部分图的数据和代码,很好的学习材料,感兴趣的同学可以找来参考,今天的推文重复一下论文中的Figure2bimage.png部分数据集截图如下相对丰度数据image.png分组数据image.png读取数据集读取相对丰

「干活」基因组组装之前要做的:Genome Survey

基因组组装之前,有一些问题还是需要注意的,genomesize是多少?评估得到的genomeheterozygosity是多少?重复序列的占比是多少?可以系统性地称为genomesurvey,这是一个非常简单的分析,但是其实有一些问题是值得注意的GenomeSurvey一般基于Illuminashortreads进行分析,因为二代测序便宜,先测出来试试水,再判断三代的数据量,这应该算是一个非常经济实惠的做法。分析流程1)fastp、Trimmomatic等软件挑一个过滤低质量序列2)Jellyfish2.3.0、KMC3我个人其实比较喜欢KMC,因为可以直接读取.gz文件(绝对不是因为之前KM

DNA 6. 基因组变异之绘制精美瀑布图(ComplexHeatmap)

桓峰基因公众号推出基于基因组变异数据生信分析教程并配有视频在线教程,目前整理出来的教程目录如下:DNA 1. Germline Mutation Vs. Somatic Mutation 傻傻分不清楚DNA 2. SCI 文章中基因组变异分析神器之 maftools DNA 3. SCI 文章中基因组变异分析神器之 maftoolsDNA 4. SCI 文章中基因组的突变信号(maftools)DNA 5. 基因组变异文件VCF格式详解DNA6.基因组变异之绘制精美瀑布图(ComplexHeatmap)最近刚好在做项目,就感觉maftools里面的瀑布图不是很好用,于是就改成使用Complex

ChatGPT启发,谷歌DeepMind预测7100万基因突变!AI破译人类基因遗传登Science

蛋白质预测模型AlphaFold在AI界掀起海啸级巨浪后,Alpha家族又迎来新贵。今天,GoogleDeepMind发布了全新AI模型——AlphaMissense,能够预测出7100万「错义突变」。具体讲,AlphaMissense成功预测出的89%「错义突变」中,57%是致病性,32%是良性的。论文地址:https://www.science.org/doi/10.1126/science.adg7492而仅有0.1%的变异,能被人类专家确认。为了研究人员更好了解其可能产生的影响,谷歌还将这份千万级「错义突变」所有目录公开。一直以来,发现根本病因是人类遗传学面临的最大挑战之一。而错义突变

DeepMind 推出 AI 工具 Alpha Missense,用于预测人类的有害基因突变

9月20日消息,谷歌旗下DeepMind日前推出了名为AlphaMissense的AI工具,其中评估了所有7100万个“错义”突变,IT之家经过查询得知,该工具已经上架GitHub,研究结果日前也已经发表在《科学》杂志上。据悉,人类专家迄今只发现了0.1%的错义变体的临床影响,这些变体改变了人体主要工作分子(蛋白质)的结构。在这些突变中,人类遗传密码中的一个字母发生了变化。其中32%被归类为可能致病,57%为良性,其余不确定。AlphaMissense预测显示了两种蛋白质结构的突变,其中红色为有害,蓝色为良性,灰色为不确定。DeepMind伦敦总部的项目研究员ŽigaAvsec声称:“此前发现

细胞器基因组的组装和注释(Getorganelle )

之前有过用二代测序的数据组装植物叶绿体基因组昆虫线粒体的经历,用的是单位的超算(Linux系统)。用到的软件为Getorganelle和Mitofinder,这里先介绍Getorganelle。GetOrganelle官网:https://github.com/Kinggerm/GetOrganelle下面的教程基本来自于对官网教程的翻译,如有需要可以去看官网原文。ThistoolkitassembliesorganellegenomesfromgenomicskimmingdataGetOrganelle的主要用途是用基因组测序数据组装完整的细胞器基因组,需要调用的软件包括SPAdes、Bo

利用贝叶斯的方法获得cell cluster的marker基因

理论参考文章为:genesorteR简单理解下,每个celltype的marker基因,它们的表达量一定具有celltype特异性的假设单细胞表达矩阵为m×n的单细胞表达矩阵,m个基因和n个cell,并且n个细胞划分到了k个cellcluster里面,作者通过贝叶斯公式:来反应每个cellcluster中的基因特异性其中:t∈{t1,t2,...,tk},代表不同的cellclusterP(ti|gj)代表在检测到genej(gj)有表达的条件下,观测该cell(单个cell)属于cellclusterti的概率;其中gj代表genejP(gj|ti)代表在cellclusterti的细胞中检

如何下载基因组注释文件和复制链接(以GCA_000817325.1为例)

进入NCBI,search点击Genomes勾选,DownloadPackage,选择基因组注释文件,有GFF、GTF两种格式这样就可以直接下载基因组注释文件啦如何得到基因组注释文件的链接?点击ASM81732v1点击legacyAssemblypage有两个数据库可以选择,这里选用了RefSeq右键选择你想要的文件,就可以打开链接或者直接复制链接啦下载wgethttps://ftp.ncbi.nlm.nih.gov/genomes/all/GCA/000/817/325/GCA_000817325.1_ASM81732v1/GCA_000817325.1_ASM81732v1_genomic

安装基因组注释流程braker2

github链接https://github.com/Gaius-Augustus/BRAKER参考链接https://www.jianshu.com/p/e6a5e1f85ddagithub主页上的安装流程看着还挺麻烦的参考链接里提到可以用conda安装我就试着用conda安装新建一个虚拟环境condacreate-nbraker2condaactivatebraker2condainstallbraker2这一步卡了一晚上也没有成功,看到有人说可以用mamba试一下mambainstallbraker2这个可以,但是遇到了一个报错Couldnotsolveforenvironmentspe