衍生物_草庐IT

【Linux】生物信息软件安装过程

image.png变量显示变量值：echo$变量名变量名之前一定要有$符号，echo才能将变量名替换成实际变量值。PATH存放命令的查找方式，类似快捷方式。which查看命令的位置。系统级配置文件：/etc/profile用户配置文件：~/.bashrc查看linux常见命令：man.linux【linux命令大全】windows下查看环境变量：我的电脑-属性-高级系统设置正式安装软件1.Root安装2.Conda安装小炒：搜索“condacheatsheet”好处：第三方软件齐全，安装方便。多环境管理，避免软件冲突。不需要root权限，可自由安装软件。添加channelchannel是有顺序

【Linux】生物信息软件安装过程

image.png变量显示变量值：echo$变量名变量名之前一定要有$符号，echo才能将变量名替换成实际变量值。PATH存放命令的查找方式，类似快捷方式。which查看命令的位置。系统级配置文件：/etc/profile用户配置文件：~/.bashrc查看linux常见命令：man.linux【linux命令大全】windows下查看环境变量：我的电脑-属性-高级系统设置正式安装软件1.Root安装2.Conda安装小炒：搜索“condacheatsheet”好处：第三方软件齐全，安装方便。多环境管理，避免软件冲突。不需要root权限，可自由安装软件。添加channelchannel是有顺序

生物 Linux section strong code

生物信息软件/流程dockerfile打包参考

生信软件、流程依赖的东西太多，docker打包镜像一不小心就是上Gb大小。镜像太大很多缺点：上传、拉取慢；费宽带；占空间。。。docker已广泛应用在IT，生信只是沾了点光，所以没有专门的优化，在这方面的资料也比较少（尤其是中文）。这里贴几点资源，供参考。常见生信软件的docker镜像及其dockerfileBioinformaticsDockerImagesProjectBioinformaticsDockerImagesProjecthttps://pegi3s.github.io/dockerfiles/由PhenotypicEvolutionGroup-IBMC/i3S团队维护。所有镜

dockerfile 生物 amp SETUPDIR RUN

生物信息软件/流程dockerfile打包参考

生信软件、流程依赖的东西太多，docker打包镜像一不小心就是上Gb大小。镜像太大很多缺点：上传、拉取慢；费宽带；占空间。。。docker已广泛应用在IT，生信只是沾了点光，所以没有专门的优化，在这方面的资料也比较少（尤其是中文）。这里贴几点资源，供参考。常见生信软件的docker镜像及其dockerfileBioinformaticsDockerImagesProjectBioinformaticsDockerImagesProjecthttps://pegi3s.github.io/dockerfiles/由PhenotypicEvolutionGroup-IBMC/i3S团队维护。所有镜

dockerfile 生物 amp SETUPDIR RUN

利用 bioconda 管理生物信息软件

1了解conda，anaconda，miniconda，bioconda套娃1.1condaconda是一个软件模块管理工具，也是一个可执行命令，其核心功能是包管理与环境管理，可以用来管理Python,R,Ruby,Lua,Scala,Java,JavaScript,C/C++,FORTRAN等语言的模块。在python中使用比较多，有点类似于pip工具。conda的用途：快速安装、运行和升级包及其依赖项在计算机中便捷地创建、保存、加载和切换环境1.2anacondaanaconda是一个开源的Python发行版本，包含了conda、Python等180多个科学包及其依赖项。Anaconda具

bioconda 生物 section conda https

利用 bioconda 管理生物信息软件

1了解conda，anaconda，miniconda，bioconda套娃1.1condaconda是一个软件模块管理工具，也是一个可执行命令，其核心功能是包管理与环境管理，可以用来管理Python,R,Ruby,Lua,Scala,Java,JavaScript,C/C++,FORTRAN等语言的模块。在python中使用比较多，有点类似于pip工具。conda的用途：快速安装、运行和升级包及其依赖项在计算机中便捷地创建、保存、加载和切换环境1.2anacondaanaconda是一个开源的Python发行版本，包含了conda、Python等180多个科学包及其依赖项。Anaconda具

bioconda 生物 section conda https

kraken2 微生物物种分类

kraken是微生物组分析进行物种分类的工具，目前已经是第二代kraken2了。kraken2对比kraken重点优化了数据库创建速度和数据库大小，以及分类速度。kraken用k-mer方法对输入数据的每一条序列进行分类分析。将每一条序列分成多个k-mers,每个k-mer在分类数据库寻找LCA(lowestcommonancestor),序列所有k-mers所在的分类及其祖先组成一个分类树————属于总分类树的子集，这个分类树每个节点的权重是序列k-mers分配到该分类的次数。分类树上每个RTL(root-to-leaf)路径得分是这些权重总分，得分最高的路径是分类路径。然后将该路径分类le

微生物种 kraken kraken2 code

kraken2 微生物物种分类

kraken是微生物组分析进行物种分类的工具，目前已经是第二代kraken2了。kraken2对比kraken重点优化了数据库创建速度和数据库大小，以及分类速度。kraken用k-mer方法对输入数据的每一条序列进行分类分析。将每一条序列分成多个k-mers,每个k-mer在分类数据库寻找LCA(lowestcommonancestor),序列所有k-mers所在的分类及其祖先组成一个分类树————属于总分类树的子集，这个分类树每个节点的权重是序列k-mers分配到该分类的次数。分类树上每个RTL(root-to-leaf)路径得分是这些权重总分，得分最高的路径是分类路径。然后将该路径分类le

微生物种 kraken kraken2 code

数据分析：微生物数据分析注意事项

微生物数据特点SparsityCompositionalOverdispersionSparsity即使在同一环境中，不同样本的微生物出现概率或者丰度都是不一样的，大部分微生物丰度极低。又因为在测序仪的检测极限下，微生物丰度（相对或绝对丰度）为0的概率又极大增加了。除此之外，比对所使用的数据库大小也即是覆盖物种率也会对最终的微生物丰度表达谱有较大的影响。最后我们所获得的微生物丰度谱必然含有大量的零值，它有两种情况，一种是真实的零值，另一种是误差导致的零值。很多算法会针对这两个特性构建不同的处理零值策略。零值数量的大小构成了微生物丰度谱稀疏性。在某次16s数据的OTU水平中，零值比例高达80%以

微生注意事项丰度的

数据分析：微生物数据分析注意事项

微生物数据特点SparsityCompositionalOverdispersionSparsity即使在同一环境中，不同样本的微生物出现概率或者丰度都是不一样的，大部分微生物丰度极低。又因为在测序仪的检测极限下，微生物丰度（相对或绝对丰度）为0的概率又极大增加了。除此之外，比对所使用的数据库大小也即是覆盖物种率也会对最终的微生物丰度表达谱有较大的影响。最后我们所获得的微生物丰度谱必然含有大量的零值，它有两种情况，一种是真实的零值，另一种是误差导致的零值。很多算法会针对这两个特性构建不同的处理零值策略。零值数量的大小构成了微生物丰度谱稀疏性。在某次16s数据的OTU水平中，零值比例高达80%以

微生注意事项丰度的