草庐IT

EDTA注释重复序列之安装篇

小明的数据分析笔记本 2023-10-11 原文

github主页

https://github.com/oushujun/EDTA

按照主页的帮助文档 我用conda安装

conda env create -f EDTA.yml

可能是网络的问题 一直没有成功

用网络稍微好一点的服务器,运行

conda env create -f EDTA.yml

这个成功了

然后把这个环境打包下来

conda install conda-pack -y 
conda pack -n EDTA -o EDTA.tar.gz

然后把打包好的文件下载下来,放到我分析数据的服务器上

mkdir EDTA
tar -xzf EDTA.tar.gz -C EDTA

然后把github主页的软件包下载下来

启动这个EDTA的环境

source EDTA/bin/activate

然后运行命令

perl ~/biotools/EDTA/EDTA.pl -genome at_chr1.fa -species others -step all -t 8

遇到报错

Fri Feb 17 09:58:03 CST 2023    Dependency checking:
Error: The RMblast engine is not installed in RepeatMasker!

查了一下这个报错,找到

https://github.com/oushujun/EDTA/issues/11

image.png

可以指定repeatmasker的路径

我之前用conda安装过repeatmasker

试一下命令

EDTA.pl -genome at_chr1.fa -species others -step all -t 8 --repeatmasker /home/myan/anaconda3/envs/repeat/bin/RepeatMasker

这个也不行,还是有报错,忘记截图了,

猜测是打包的conda环境有关,一直提示的就是在某个路径下找不到某个脚本,而且那个路径很奇怪,我搜索了一下这个报错也没有找到对应的解决办法

github主页还介绍了使用mamba安装的方法,我再试这个方法

首先是运行这个命令

mamba install -c conda-forge -c bioconda edta python=3.6 tensorflow=1.14 'h5py<3'

有报错,但是报错忘记截图了

然后我把 -c参数的内容去掉 (为啥去掉这个参数 我也说不清楚,就是瞎试)

mamba install edta python=3.6 tensorflow=1.14 'h5py<3'

还是报错,而且这一步卡了很长时间,具体多长时间我也不知道,报错信息是

Could not solve for environment specs
Encountered problems while solving:
  - nothing provides libmamba 0.23.1 h1566912_0 needed by libmambapy-0.23.1-py310hd09550d_0

The environment can't be solved, aborting the operation

猜测是python版本的问题,因为python3.6,有点老了

单独安装python3.6试试

mamba install python=3.6

和上面的报错一样

把python改成3.7试试

mamba install python=3.7

幸运这次没有报错了,然后再安装另外一个依赖

mamba install tensorflow=1.14 'h5py<3'

幸运没有报错

最后安装edta

mamba install edta -y

没有报错

使用

EDTA.pl -genome at_chr1.fa -species others -step all -t 8

这个好像成功了

运行完中间有个提示信息

Use of uninitialized value $seq_new in substr at /home/myan/anaconda3/envs/EDTA/share/EDTA/util/cleanup_nested.pl line 190.
Thread 1 terminated abnormally: substr outside of string at /home/myan/anaconda3/envs/EDTA/share/EDTA/util/cleanup_nested.pl line 190

不知道有没有影响

结果怎么看还得研究

前后折腾了好几天

有关EDTA注释重复序列之安装篇的更多相关文章

  1. ruby - 是否有用于序列化和反序列化各种格式的对象层次结构的模式? - 2

    给定一个复杂的对象层次结构,幸运的是它不包含循环引用,我如何实现支持各种格式的序列化?我不是来讨论实际实现的。相反,我正在寻找可能会派上用场的设计模式提示。更准确地说:我正在使用Ruby,我想解析XML和JSON数据以构建复杂的对象层次结构。此外,应该可以将该层次结构序列化为JSON、XML和可能的HTML。我可以为此使用Builder模式吗?在任何提到的情况下,我都有某种结构化数据-无论是在内存中还是文本中-我想用它来构建其他东西。我认为将序列化逻辑与实际业务逻辑分开会很好,这样我以后就可以轻松支持多种XML格式。 最佳答案 我最

  2. ruby - 在好的 Ruby 代码中没有注释是否被认为是可以接受的? - 2

    关闭。这个问题是opinion-based.它目前不接受答案。想要改进这个问题?更新问题,以便editingthispost可以用事实和引用来回答它.关闭5年前。Improvethisquestion我审查了一些用Ruby编写的专业代码,没有发现任何评论。代码读起来相当清晰,但没有self记录。我应该期望专业编写的Ruby代码有注释吗?或者,是否有一些Ruby原则认为注释不是必需的?

  3. ruby - 在 Ruby 中比较序列 - 2

    假设我必须(小型到中型)阵列:tokens=["aaa","ccc","xxx","bbb","ccc","yyy","zzz"]template=["aaa","bbb","ccc"]如何确定tokens是否以相同的顺序包含template的所有条目?(请注意,在上面的示例中,应忽略第一个“ccc”,从而由于最后一个“ccc”而导致匹配。) 最佳答案 这适用于您的示例数据。tokens=["aaa","ccc","xxx","bbb","ccc","yyy","zzz"]template=["aaa","bbb","ccc"]po

  4. ruby - 正则表达式 - 保存重复捕获的组 - 2

    这就是我做的a="%span.rockets#diamonds.ribbons.forever"a=a.match(/(^\%\w+)([\.|\#]\w+)+/)putsa.inspect这是我得到的#这就是我想要的#帮助?我尝试过但失败了:( 最佳答案 通常,您不能获得任意数量的捕获组,但如果您使用扫描,您可以为您想要捕获的每个标记获得一个匹配:a="%span.rockets#diamonds.ribbons.forever"a=a.scan(/^%\w+|\G[.|#]\w+/)putsa.inspect["%span","

  5. ruby-on-rails - carrierwave:在序列化动态属性上安装 uploader - 2

    首先,我使用的是rails3.1.3和来自master的carrierwavegithub仓库的分支。我使用after_init钩子(Hook)来确定基于属性的字段页面模型实例并为这些字段定义属性访问器将值存储在序列化哈希中(希望它清楚我是什么谈论)。这是我正在做的事情的精简版:classPage省略mount_uploader命令让我可以访问我想要的属性。但是当我安装uploader时出现错误消息说“nil类的未定义新方法”我在源代码中读到有方法read_uploader和扩展模块中的write_uploader。我如何必须覆盖这些来制作mount_uploader命令使用我的“虚拟

  6. Ruby 从数组中删除重复的对象 - 2

    我无法使用传统的Ruby方法从下面的数组user_list中删除所有重复对象,从而获得预期的结果。有解决这个问题的聪明方法吗?users=[]user_list.eachdo|u|user=User.find_by_id(u.user_id)users 最佳答案 这个怎么样?users=User.find(user_list.map(&:user_id).uniq)这具有作为一个数据库调用而不是user_list.size数据库调用的额外好处。 关于Ruby从数组中删除重复的对象,我们在

  7. Ruby 删除可枚举列表中的重复项 - 2

    ruby中有没有一个很好的方法来删除可枚举列表中的重复项(即拒绝等) 最佳答案 对于数组你可以使用uniq()方法a=["a","a","b","b","c"]a.uniq#=>["a","b","c"]所以如果你只是(1..10).to_a.uniq或%w{antbatcatant}.to_a.uniq因为无论如何,几乎所有您实现的方法都将作为Array类返回。 关于Ruby删除可枚举列表中的重复项,我们在StackOverflow上找到一个类似的问题: h

  8. ruby - 重复排列 - 2

    我知道如何创建值数组的排列。例如:[*1..3].permutation(2)这导致以下六种排列:[1,2][1,3][2,1][2,3][3,1][3,2]但这个结果缺少三个排列,它们是相同值的组合,即:[1,1][2,2][3,3]如何获得所有排列,包括上面重复的排列? 最佳答案 尝试#repeated_permutation:[*1..3].repeated_permutation(3).to_a>pp[*1..3].repeated_permutation(3).to_a[[1,1,1],[1,1,2],[1,1,3],[1

  9. 机器学习——时间序列ARIMA模型(四):自相关函数ACF和偏自相关函数PACF用于判断ARIMA模型中p、q参数取值 - 2

    文章目录1、自相关函数ACF2、偏自相关函数PACF3、ARIMA(p,d,q)的阶数判断4、代码实现1、引入所需依赖2、数据读取与处理3、一阶差分与绘图4、ACF5、PACF1、自相关函数ACF自相关函数反映了同一序列在不同时序的取值之间的相关性。公式:ACF(k)=ρk=Cov(yt,yt−k)Var(yt)ACF(k)=\rho_{k}=\frac{Cov(y_{t},y_{t-k})}{Var(y_{t})}ACF(k)=ρk​=Var(yt​)Cov(yt​,yt−k​)​其中分子用于求协方差矩阵,分母用于计算样本方差。求出的ACF值为[-1,1]。但对于一个平稳的AR模型,求出其滞

  10. ruby - 在 Ruby 数组中收集重复项的最快/单行方法? - 2

    像这样转换数组的最快/单行方法是什么:[1,1,1,1,2,2,3,5,5,5,8,13,21,21,21]...进入像这样的对象数组:[{1=>4},{2=>2},{3=>1},{5=>3},{8=>1},{13=>1},{21=>3}] 最佳答案 要获得所需的格式,您可以附加一个调用以映射到您的解决方案:array.inject({}){|h,v|h[v]||=0;h[v]+=1;h}.map{|k,v|{k=>v}}虽然它仍然是单行的,但它开始变得凌乱了。 关于ruby-在Ruby

随机推荐