草庐IT

基因组

全部标签

DeepMind 推出 AI 工具 Alpha Missense,用于预测人类的有害基因突变

9月20日消息,谷歌旗下DeepMind日前推出了名为AlphaMissense的AI工具,其中评估了所有7100万个“错义”突变,IT之家经过查询得知,该工具已经上架GitHub,研究结果日前也已经发表在《科学》杂志上。据悉,人类专家迄今只发现了0.1%的错义变体的临床影响,这些变体改变了人体主要工作分子(蛋白质)的结构。在这些突变中,人类遗传密码中的一个字母发生了变化。其中32%被归类为可能致病,57%为良性,其余不确定。AlphaMissense预测显示了两种蛋白质结构的突变,其中红色为有害,蓝色为良性,灰色为不确定。DeepMind伦敦总部的项目研究员ŽigaAvsec声称:“此前发现

细胞器基因组的组装和注释(Getorganelle )

之前有过用二代测序的数据组装植物叶绿体基因组昆虫线粒体的经历,用的是单位的超算(Linux系统)。用到的软件为Getorganelle和Mitofinder,这里先介绍Getorganelle。GetOrganelle官网:https://github.com/Kinggerm/GetOrganelle下面的教程基本来自于对官网教程的翻译,如有需要可以去看官网原文。ThistoolkitassembliesorganellegenomesfromgenomicskimmingdataGetOrganelle的主要用途是用基因组测序数据组装完整的细胞器基因组,需要调用的软件包括SPAdes、Bo

利用贝叶斯的方法获得cell cluster的marker基因

理论参考文章为:genesorteR简单理解下,每个celltype的marker基因,它们的表达量一定具有celltype特异性的假设单细胞表达矩阵为m×n的单细胞表达矩阵,m个基因和n个cell,并且n个细胞划分到了k个cellcluster里面,作者通过贝叶斯公式:来反应每个cellcluster中的基因特异性其中:t∈{t1,t2,...,tk},代表不同的cellclusterP(ti|gj)代表在检测到genej(gj)有表达的条件下,观测该cell(单个cell)属于cellclusterti的概率;其中gj代表genejP(gj|ti)代表在cellclusterti的细胞中检

如何下载基因组注释文件和复制链接(以GCA_000817325.1为例)

进入NCBI,search点击Genomes勾选,DownloadPackage,选择基因组注释文件,有GFF、GTF两种格式这样就可以直接下载基因组注释文件啦如何得到基因组注释文件的链接?点击ASM81732v1点击legacyAssemblypage有两个数据库可以选择,这里选用了RefSeq右键选择你想要的文件,就可以打开链接或者直接复制链接啦下载wgethttps://ftp.ncbi.nlm.nih.gov/genomes/all/GCA/000/817/325/GCA_000817325.1_ASM81732v1/GCA_000817325.1_ASM81732v1_genomic

安装基因组注释流程braker2

github链接https://github.com/Gaius-Augustus/BRAKER参考链接https://www.jianshu.com/p/e6a5e1f85ddagithub主页上的安装流程看着还挺麻烦的参考链接里提到可以用conda安装我就试着用conda安装新建一个虚拟环境condacreate-nbraker2condaactivatebraker2condainstallbraker2这一步卡了一晚上也没有成功,看到有人说可以用mamba试一下mambainstallbraker2这个可以,但是遇到了一个报错Couldnotsolveforenvironmentspe

泛基因组分析流程psvcp:试着运行流程中提供的示例数据

流程github主页https://github.com/wjian8/psvcp_v1.01对应论文Apangenomeanalysispipelineprovidesinsightsintofunctionalgeneidentificationinrice依赖软件除了mummer4.0以外都可以用conda安装mummer安装遇到的报错运行如下命令./configure--prefix=/home/myan/biotools/mummer-4.0.0beta报错信息error:Compilerdoesnotsupportstd::this_thread::sleep_for查了一下这个报

9分1区SCI,单基因分析结合简单实验验证,有样本真的可以为所欲为!

小编一直觉得单基因泛癌的文章进可攻(纯生信发文)退可守(补实验)。小编已经有不少客户发了单基因生信文章后,开始做实验进行深入研究,后续可以继续发文章写基金。比较老的客户已经成功拿到经费。之前小编写过生信筛选的单基因如何补充实验欢迎查看之前的文章研究背景:胰腺导管腺癌(PDAC)仍然是世界上最致命的恶性肿瘤之一,据估计是新癌症病例的第11个主要原因,预计到2030年将成为美国第二大死亡原因。目前正在积极研究针对局部PDAC的多学科治疗策略。G蛋白偶联受体(GPCRs)在哺乳动物中由五个主要家族组成,最大的是视紫红质家族,在人类中有大约284个成员(加上大约380个嗅觉受体),其次是粘附GPCR家

基因家族数据库网站更新:pfam to InterPro

在基因家族分析中,通过pfam数据库检索获得已知基因家族的hmm模型(隐马模型)是必不可少的一步,最近发现pfam数据库有变动,和大家分享一下。1.pfam数据库pfam数据库是一个很常用的蛋白家族数据库,以UniProt数据库收录的蛋白数据为依据创建,目前更新至35.0版本(November2021,19632条数据)。在该数据库可以下载某个基因家族对应的hmm模型文件、比对序列、物种信息、HMMlogo等数据。pfam-data.png其中hmm模型文件包含基因家族序列特征信息,可以搭配hmmer软件,进行基因家族成员的鉴定。示例如下。HMMER3/f[3.1b2|February2015

根据免疫细胞浸润情况鉴定新的预后相关基因特征

IdentificationofaNovelPrognosticGeneSignatureFromtheImmuneCellInfiltrationLandscapeofOsteosarcoma从骨肉瘤的免疫细胞浸润情况中鉴定新的预后基因特征发表期刊:FrontCellDevBiol发表日期:202106SeptemberDOI:10.3389/fcell.2021.718624期刊相关信息一、背景        近年来,肿瘤微环境(TME)在肿瘤的发生发展中起着至关重要的作用,受到了人们的关注。肿瘤微环境包括肿瘤细胞、成纤维细胞、内皮细胞、免疫细胞、各种信号分子和细胞外基质。最新研究表明,肿

又见8+基于单细胞marker基因的纯生信文章,仍然可以模仿并超越!

本文的思路是通过单细胞数据分析识别了某种免疫细胞特有的marker基因,然后利用这些基因进行预后模型的构建。事实上,预后模型的文章已经不好发了,甚至有的审稿人看到预后模型就反感,因为实在是太多了,而且预测效能普遍不行。那么如何做的比这篇文章还要好呢?鉴于最近泛癌分析以及肿瘤分型分析比较好发,小编做的免疫细胞marker的泛癌分析以及肿瘤分型,内容是这些文章的2倍以上,均发表到8+杂志。所以我们在筛选到某种免疫细胞特有的marker基因后,可以对这些基因进行泛癌分析或者肿瘤分型分析。在分型分析中再附上简单的预后模型,但不以其为重点。这样的思路肯定是比本篇文章内容更多,更新颖。如果想做类似分析,欢