草庐IT

GTF处理脚本 - GTFtools

image.png主要功能及示例:1)计算merged外显子合并同一个基因的所有spliceisoforms的外显子,并生成bed格式文件,可以用来计算具有多个isoforms的基因的非重叠外显子长度pythongtftools.py-mmerged_exons.beddemo.gtf2)计算independentintronspythongtftools.py-dindependent_introns.beddemo.gtf3)计算基因长度由于一个基因可能有多个isoforms,因此作者提供了4种基因长度计算方法:mean,median,max及mergedexons,其中mergedexo

学python:使用python的pyRanges模块中的read_gtf函数读取gtf文件老是报错的解决办法

pyRanges的帮助文档https://biocore-ntnu.github.io/pyranges/loadingcreating-pyranges.htmlimage.png我自己的gtf文件是这样的ID和后面字符串是用等号链接的,通常image.png是用空格,所以他定义函数用来查拆分字符串的时候是用空格来分隔的,所以这个地方我们把读取代码稍微改动一下,就是增加一个等号作为分隔符首先定义拆分最后一列的函数defto_rows(anno):rowdicts=[]try:l=anno.head(1)forlinl:l.replace('"','').replace(";","").spl