草庐IT

生信地基系列--PWM位置权重矩阵

位置权重矩阵(PWM)又称位置特异性权重矩阵(position-specificweightmatrix,PSWM)或位置特异性评分矩阵(position-specificscoringmatrix,PSSM),是生物序列中常用的基序(motif)表示。PWM通常来源于一组被认为是功能相关的对齐序列,并且已经成为许多用于计算基序发现的软件工具的重要组成部分。变换顺序如下序列转换为位置频数矩阵(positionfrequencymatrix),然后转换为位置概率矩阵(positionprobabilitymatrix,PPM)———>将位置转移矩阵转换为位置权重矩阵序列到位置概率矩阵的转换PWM

生信脚本代写

主营业务:1,python相关的流程搭建或指导。批处理数据,文本文件,python处理Excel文件fastq格式介绍,文件提取处理等。生信入门指导2,脚本处理拆分fastq,数据质控,过滤,比对结果分析等。3,R语言R的安装(有/无root权限),R包的安装,死磕各种疑难杂症--ggplot2画图等--bioconductor包等--生物统计类分析(ANOV等)4,linux系统相关的最头疼的生物信息学软件安装,数据库下载等。常用linux操作命令(awk,sed,grep)使用方法及快捷方式磁盘管理,网络,进程,文件,系统配置,防火墙等操作。熟悉docker容器化技术,熟练镜像的相关操作。

生信log34|dbNSFP的phyloP30_score的来源-以提取hg38_phyloP30way.bw(bigwig)数据为例

dbNSFP数据库收录了PhyloP值的数据,并且是tsv格式的,为了对一下数据库,就去官网找了相关的数据,但是看了一圈并没有现成的tsv。看了一圈资料也没看出怎么得出dbNSFP里面的phyloP这个唯一值怎么来的。后面尝试了很多,才发现原来如此简单:就是把官网上的bw文件转成bedGraph文件即可,但是这个做法会把7.9G的数据拓展至50G左右,转换数据需慎重。1、工具准备及其用法下载ucsc上的工具bigWigToBedGraph(转换bigwig到bedGraphformat)下载bigWigToWig(非必需)#bigWigToBedGraphwgethttps://hgdownl

最新7+非肿瘤生信,机器学习筛选关键基因+样本验证。目前机器学习已经替代WGCNA成为筛选关键基因方法。非肿瘤生信分析欢迎咨询!

影响因子:7.31关于非肿瘤生信,我们也解读过很多目前非肿瘤中结合热点基因集,免疫浸润,机器学习,分型的分析是比较先进的。有需要的分析的朋友欢迎交流!!研究概述:心房颤动(AF)是缺血性卒中的主要危险因素,而仅凭临床特征和神经影像学表现都不能可靠地分类心源性栓塞性卒中(CE)。本研究旨在确定在心房颤动相关心源性栓塞性卒中(AF-CE)患者中具有诊断价值的新型潜在生物标志物,区分AF-CE与其他类型缺血性卒中。研究者对AF和CE的共同的DEGs进行综合分析后,使用LASSO和SVM-RFE两种机器学习算法确定了三个诊断标志物C1QC、VSIG4和CFD。然后采用RT-qPCR分析了3种诊断标志物

生信分析中 功能注释常用数据库下载地址 --- 持续更新

更新于:2023-01-18多线程下载工具axel的安装和使用#下载源码包$wgethttps://github.com/axel-download-accelerator/axel/releases/download/v2.17.11/axel-2.17.11.tar.gz#解压,进入目录$tarxzvfaxel-2.17.11.tar.gz$cdaxel-2.17.11/#检查编译$./configure--prefix=/Work/Rd/Project/tools/axel-2.17.11[非root用户,这里替换成你要安装的路径]$make&&makeinstall#下面就可以正常使用

最新9.6分1区文章,基因家族单肿瘤生信+实验

**影响因子9.685关于单基因生信+实验验证发高分杂志,我们也解读过类似的文章。**我们可以综合各个文章中的内容,筛选新的基因集/复合物/通路/基因家族等进行分析。如果需要的话可联系小编预定生信分析咨询请关注生信小课堂研究背景:以有氧糖酵解和线粒体氧化磷酸化功能障碍为特征的能量代谢重编程是癌症发生中的重要标志。线粒体膜转运蛋白位于线粒体内膜内,可作为代谢底物的载体,下图A详细阐述了线粒体SLC25所携带的代谢底物及在线粒体中的相关生物过程。SLC25编码了53个转运蛋白。DNA突变或SLC25的异常表达会通过异常代谢导致癌性疾病和非癌性疾病。在该研究中,作者使用公共数据库的数据集,全面解析了

最新11+单基因泛癌纯生信,值得学习!

影响因子:11.6关于单基因泛癌分析,我们已经介绍了很多。小编最近也筛选到一些结果比较好的基因,需要做深入分析的可以联系小编喔。生信分析咨询请关注公众号“生信小课堂”研究概述:APOBEC(载脂蛋白BmRNA编辑酶)家族介导的诱变在人类癌症中广泛存在。然而,现在对APOBECs和APOBEC突变在癌症中的生物学特征和临床相关性的了解仍然有限。本研究通过一系列的生物信息学和统计方法,对多个层次的数据进行了全面分析,包括全外显子组测序和靶向下一代测序、转录组、免疫签名和免疫检查点封锁(ICB)潜在潜力、患者生存和药物敏感性,以揭示APOBECs和APOBEC突变在泛癌特别是膀胱癌(BLCA)中的分

生信工作流框架搭建 | 04-nextflow与Slurm高性能计算

目录生信工作流框架搭建|04-nextflow与Slurm高性能计算前情提要什么是HPC高性能计算什么是slurmnextflow配置注意事项下期预告生信工作流框架搭建|04-nextflow与Slurm高性能计算本篇为biodoge《生信工作流框架搭建》系列笔记的第5篇,该系列将持续更新。前情提要上回生信工作流框架搭建|03-nextflow与AWS批量计算为大家提供了nextflow上云的实用教程。虽然AWS批量计算技术含量较大,但毕竟在国内应用场景较少,下面将为大家介绍另一种更为常用的应用:阿里云的HPC高性能计算。本身slurm+nextflow操作非常简单,但是鉴于网络资料较少,且有

SNP注释神器——VEP(生信)

VEP使用简介1.背景知识2.vep功能2.1可注释变异类型2.2注释结果信息2.3过滤筛选3.软件下载与安装3.1安装vep的方式4.vep的使用4.1.使用基本的参数进行测试4.2在docker下使用1.背景知识二代测序发现的变异数量是巨大的,以人类基因组为例,1个人类基因组包含近3500000个SNV突变和1000个拷贝数变异,其中约20000-25000个变异是在编码区,10000个位点发生了氨基酸编码改变,仅有50-100个发生了蛋白截断或功能缺失,手动检查每个位点非常耗时且有些不切实际。VariantEffectPredictor(VEP)是一个功能强大的工具集,用于编码和非编码区

【Python生信编程笔记】二、初识Python(一)

##一、安装Python**Python下载地址**:[https://www.python.org/downloads/windows](https://www.python.org/downloads/windows)**Anaconda下载地址**:[https://www.anaconda.com/products/distribution](https://www.anaconda.com/products/distribution)**PythonAnywhere**:[https://www.pythonanywhere.com/](https://www.pythonanywh