草庐IT

生物信息学中常用的linux命令(二)

生信开荒牛 2023-10-24 原文

一、压缩和解压缩

  1. “tar.gz”结尾的文件: tar

#将file1,file2文件打包到newfile.tar
tar -cf newfile.tar file1 file2 
#将test.tar.gz文件解压并提取里边的文件
tar -xzvf test.tar.gz 
  1. “.zip”结尾的文件: zip

#将file1,file2进行压缩到newfile.zip内
zip newfile.zip file1 file2
#解压
unzip newfile.zip
  1. “.gz”结尾的文件: gzip

#将file压缩为file.gz
gzip file 
#解压
gunzip file.gz
  1. “.bz2”结尾的文件: bzip2

#将file压缩为file.bz2并删除源文件
bzip2 file 
#解压
bunzip2file.bz2

二、数据统计与处理

  1. sort 将文本文件内容进行排序

    参 数:
    -n/-g 将文件按数值大小从小到大排序(默认按ascii码从小到大排序)
    -k按第num列内容对文件排序(默认按第一列)
    -r 反向排序

#对file文件按第一列内容ascii码值从小到大排序并输出。
sort file 
#对file文件按第3列内容数值大小从小到大排序。
sort -n -k 3 file 
#对file文件按数值大小反向排序,优先考虑第一列,再考虑第二列
sort -nr -k1,2 file 
  1. uniq 合并文件中相邻的相同的行

    参 数:
    -c 在每行第一列显示该行重复次数
    -d 仅显示有重复的行

#合并相同的行,并统计每行重复次数,输出到屏幕
uniq -c file 
#合并相同的行,并显示file中有重复出现的行,输出到outfile文件中
uniq -d file outfile 
  1. wc 统计文件中字节数

    参 数:
    -c 只统计字节数/Bytes数
    -w 只统计字数(单词数)
    -l 只统计行数

#显示文件file的字节数,字数,行数
wc file 
#显示文件file的行数
wc -l file 
  1. grep 查找文件中符合条件的行

    参 数:
    -v 不匹配,显示文件中不匹配string的行

#查找文件中含有“world”的行
grep world file 
#查找文件中不含有“world”的行
grep -v world file 
  1. awk 对特定的行中特定的列进行操作

    参 数:
    -F 指定列的分割符,可以使任意字符,默认按空白分割

#按“:”来分割并打印出第一列
awk -F “:” ‘{print $1}’ 
#对第一列大于100的行整行输出
awk ‘($1 > 100){print $0}’ 
#对第一列大于100的行输出第一列和第二列的结果并以“\t”分割。
awk ‘($1 > 100){print $1”\t”$2}’ 
#对第三列匹配“world”的行的第一列求和,全部处理完之后输出结果x的值
awk ‘($3~/world/){ x+= $1}END{print x}’ 
  1. sed 文本处理并可对文件进行编辑

    参 数:
    -i 直接在原文件中修改(默认修改后屏幕输出,原文件不变)

#将file文件中的test字符替换为new_word
sed -i ‘s/test/new_word/’ file 
#将file文件中匹配pattern字串的行进行替换操作
sed -i ‘/pattern/ s/test/new_word/’ file 
#将文件file中的空白行删除(d) 
sed -i ‘/^$/ d’ file 
  1. chmod 设置文件或目录权限

    -R 对目录和目录下所有文件均设置权限
    详细说明:文件权限分为是否可读(r)、是否可写(w)、是否可执行(x)3种,同时对应档案拥有者(u)、同 组成员(g)、其他成员(o)3种。mode分为符号模式和数值模式。
    符号模式:[ugoa] [+-=] [rwx]
    数值模式:用1/0表示,则111表示可读可写可执行,000表示不可读不可写不可执行,可读可写可执行 分别对应10进制的4,2,1,则5表示可读不可写可执行。

#对file 文件用户自身增加可执行权限,同组成员权限设置为可读可写,对其他成员移除rwx权限。
chmod u+xg=rx o-rwx file 
#对file文件所有成员移除可写权限。
chmod a-w file 
#对dirname目录及其下所有文件权限设置为用户自身可读可写可执行,同组成员可读可执行,其他成员无权限。
chmod -R 750 dirname 
  1. find 查找文件

#在当前目录及其子目录下查找文件名为file的文件
find./ -name file 
#寻找文件名以a结尾的目录文件。
find ./ -name ‘*a’ -type d 
  1. du 显示目录或文件的大小

    参 数:
    -a 显示目录中个别文件大小
    -s 只显示总计
    -h 以“K” ,“M” ,“G”为单位显示

#显示当前目录的大小
du -sh ./ 
#显示dir目录下所有文件大小,不包括下一级目录
du -ah --max-depth=1 dir 

有关生物信息学中常用的linux命令(二)的更多相关文章

  1. ruby - 在 Ruby 中编写命令行实用程序 - 2

    我想用ruby​​编写一个小的命令行实用程序并将其作为gem分发。我知道安装后,Guard、Sass和Thor等某些gem可以从命令行自行运行。为了让gem像二进制文件一样可用,我需要在我的gemspec中指定什么。 最佳答案 Gem::Specification.newdo|s|...s.executable='name_of_executable'...endhttp://docs.rubygems.org/read/chapter/20 关于ruby-在Ruby中编写命令行实用程序

  2. ruby-on-rails - rbenv:从 RVM 移动到 rbenv 后,在 Jenkins 执行 shell 中找不到命令 - 2

    我从Ubuntu服务器上的RVM转移到rbenv。当我使用RVM时,使用bundle没有问题。转移到rbenv后,我在Jenkins的执行shell中收到“找不到命令”错误。我内爆并删除了RVM,并从~/.bashrc'中删除了所有与RVM相关的行。使用后我仍然收到此错误:rvmimploderm~/.rvm-rfrm~/.rvmrcgeminstallbundlerecho'exportPATH="$HOME/.rbenv/bin:$PATH"'>>~/.bashrcecho'eval"$(rbenvinit-)"'>>~/.bashrc.~/.bashrcrbenvversions

  3. ruby - 从 Ruby : capturing the output while displaying the output? 运行 shell 命令 - 2

    我有一个问题。我想从另一个ruby​​脚本运行一个ruby​​脚本并捕获它的输出信息,同时让它也输出到屏幕。亚军#!/usr/bin/envrubyprint"Enteryourpassword:"password=gets.chompputs"Hereisyourpassword:#{password}"我运行的脚本文件:开始.rboutput=`runner`putsoutput.match(/Hereisyour(password:.*)/).captures[0].to_s正如您在此处看到的那样,存在问题。在start.rb的第一行,屏幕是空的。我在运行程序中看不到“输入您的密

  4. ruby - 是否有将图像文件转换为 ASCII 艺术的命令行程序或库? - 2

    有这样的事吗?我想在Ruby程序中使用它。 最佳答案 试试这个http://csl.sublevel3.org/jp2a/此外,Imagemagick可能还有一些东西 关于ruby-是否有将图像文件转换为ASCII艺术的命令行程序或库?,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/6510445/

  5. ruby - 在 Ruby 的 if 语句中检查 bash 命令 - 2

    如何在Ruby的if语句中检查bash命令的返回值(true/false)。我想要这样的东西,if("/usr/bin/fswscell>/dev/null2>&1")has_afs="true"elsehas_afs="false"end它会提示以下错误含义,它总是返回true。(irb):5:warning:stringliteralincondition正确的语法是什么?更新:/usr/bin/fswscell寻找afs安装和运行状态。它会抛出这样的字符串,Thisworkstationbelongstocell如果afs没有运行,命令以状态1退出 最

  6. ruby - 可以正常中断的来自 Rake 的长时间运行的 shell 命令? - 2

    在几个项目中,我希望有一个类似rakeserver的rake任务,它将通过任何需要的方式开始为该应用程序提供服务。这是一个示例:task:serverdo%x{bundleexecrackup-p1234}end这行得通,但是当我准备停止它时,按Ctrl+c并没有正常关闭;它中断了Rake任务本身,它说rakeaborted!并给出堆栈跟踪。在某些情况下,我必须执行Ctrl+c两次。我可能可以用Signal.trap写一些东西来更优雅地中断它。有没有更简单的方法? 最佳答案 trap('SIGINT'){puts"Yourmessa

  7. ruby - Capistrano 中的执行、测试和捕获命令有什么区别? - 2

    关于SSHkit-Github它说:Allbackendssupporttheexecute(*args),test(*args)&capture(*args)来自SSHkit-Rubydoc,我明白execute实际上是test的别名?test之间有什么区别?,execute,capture在Capistrano/SSHKit中我应该什么时候使用? 最佳答案 执行只是执行命令。使用非0退出引发错误。测试方法的行为与execute完全相同,但是它返回bool值(true如果命令以0退出,而false否则)。它通常用于控制任务中的流程

  8. ruby - 如何在 Ruby 中执行 Windows CLI 命令? - 2

    我在目录“C:\DocumentsandSettings\test.exe”中有一个文件,但是当我用单引号编写命令时`C:\DocumentsandSettings\test.exe(我无法在此框中显示),用于在Ruby中执行命令,我无法这样做,我收到的错误是找不到文件或目录。我尝试用“//”和“\”替换“\”,但似乎没有任何效果。我也使用过系统、IO.popen和exec命令,但所有的努力都是徒劳的。exec命令还使程序退出,这是我不想发生的。提前致谢。 最佳答案 反引号环境就像双引号,所以反斜杠用于转义。此外,Ruby会将空格解

  9. ruby - 将命令行上的变量传递给 Cucumber 测试 - 2

    我正在尝试将cucumber项目的用户名和密码置于版本控制之外。有没有办法在命令行上手动将用户名和密码等变量传递给Cucumber脚本?我的备份计划是将它们放在一个YML文件中,然后将该文件添加到gitignore,这样它们就不会被置于版本控制中。 最佳答案 所以,我看到了您对铁皮人的评论,答案是肯定的。cucumberPASSWORD=my_passwordPASSWORD被设置为环境变量,您可以通过将其引用为ENV['PASSWORD']来使用它的值。例如,browser.text_field(:id=>'pwd').setEN

  10. ruby - 无法安装 gem - make 未被识别为内部或外部命令可运行程序或批处理文件 - 2

    我想在Windows7上安装带有ruby​​1.9.3的rspec-railsgem。我收到一些错误消息,提示无法安装某些json库。所以,我使用下面的说明来解决它。来源=The'json'nativegemrequiresinstalledbuildtools从[rubyinstaller.org][3]下载[Ruby1.9.3][2]从[rubyinstaller.org][3]下载DevKit文件对于Ruby1.9.3,使用[DevKit-tdm-32-4.5.2-20110712-1620-sfx.exe][4]将DevKit解压到路径C:\Ruby193\DevKit运行cd

随机推荐