康奈尔大学,FeiLab的一个预测工具。
iTAK 是依赖于数据库的用于从蛋白质或核苷酸序列中识别植物转录因子 (TF)、转录调节因子 (TR) 和蛋白激酶 (PK),然后将单个 TF、TR 和 PK 分类为不同的基因家族的工具。
本人能力有限,本文可能存在描述不当与错误的地方,请仔细辨别后使用。
TFs 和 TRs 的识别和分类是基于主要从 PlnTFDB (Perez-Rodriguez et al., 2010)和 PlantTFDB [(Jin et al., 2014) 总结的一致性规则(每个基因家族的必需和禁止的蛋白质结构域),与来自 PlantTFcat (Dai et al., 2013)和 AtTFDB (Yilmaz et al., 2011)的家族 使用了支持证据。
PKs的鉴定依赖于Pfam数据库中与PF00069和PF07714 的hits。鉴定到的PK通过与比较一系列的HMMs( Lehti-Shiu MD, Shiu S-H (2012))将其划分到不同的基因家族。
我来bici两句:iTAK发表文章中指出了两个数据库(PlnTFDB和PlantTFDB)各自的一些缺陷。plnTFDB我没用过,但是PlantTFDB在iTAK出来后是有更新的,高老师看不到这篇文章和这个工具不太可能。如果提出的问题确实存在且合理,我相信后面更新中肯定会修正的(这只是我的臆想,我的水平还不到去校对文中提到问题的水平),所以大家也不要看到iTAK发文中提到了PlantTFDB的问题就不用PlantTFDB预测TF了。
这个工具,我是在一个学长的毕业答辩上听来的。
我昨天在pubmed搜了下,印象比较深的是有两篇中药论文中都用到了这个工具。
另外,我在网上搜到了一家生信分析报告模板,其中就有用这个工具。
关于软件本地部署,中文中有些本地部署的流程,但不建议大家本地部署(数据库的更新依赖mysql),因为github中的数据库文件没有在线网页版的新。虽然我不更新数据库的本地部署与在线版的预测结果条数一致(具体序列ID并没有进行比较),但我还是用了在线版本的分析结果。
http://itak.feilab.net/cgi-bin/itak/index.cgi
第一步:进入主页http://itak.feilab.net/cgi-bin/itak/index.cgi
不需要工具,就是网络慢点。

第二步:输入数据,选择数据类型
蛋白质序列数据,以文件形式上传或者直接粘贴FASTA格式序列。
输入数据要求与限制(≈没限制):fasta格式,核苷酸或者蛋白序列,序列数<50k条且文件大小<100M。
第三步:填写接收数据邮箱。
虽然可以在线等,但是写个邮箱稳妥点。
如果提交成功则应该会跳转类似如下界面。

第四步:下载结果
我测试的3万多条蛋白序列,用了大概50分钟。
在线等结果或者复制邮箱中的网页链接到浏览器打开。
呈现如下结果(这里只截图了TF,TR):
点击左上角"Download" 就可以下载所有结果。

解压结果文件,层层打开文件夹PXXXXXXXXXX_output\home\kentnf\webfiles\bioinfo\itak\itak_web\itak_html\tmp\itak_online\PXXXXXXXXXX_output (这个文件夹属是有点深不可测)即可看到6个结果文件
所有鉴定的TF/TR序列
所有TF/TR的分类,tab制表符分割,包含序列的ID和各自的家族。
制表符分割的txt文档,包含所有鉴定到的TF/TR比对蛋白结构域数据库。
所有鉴定到的PK蛋白序列。
所有鉴定到的PK蛋白分类。制表符分割的txt文件,包含序列ID和相应的蛋白激酶家族。
制表符分割的txt文档,包含所有鉴定到的PK比对蛋白结构域数据库。
其实,这个工具我是先直接本地部署的,但是github上数据库这么久没更新,心里属实不踏实。看了下iTAK.pl ,当然是看不懂的,但是我发现了一些隐藏的选项和内容。在脚本最后的email模块发现了这个在线网址链接才知道原来还有在线版本。同时网站提供了最新数据库,但是看了下部署,竟然有用到mysql,然后直接对本地版说了拜拜。现在还没时间学习mysql。
对于作为String#tr参数的单引号字符串文字中反斜杠的转义状态,我觉得有些神秘。你能解释一下下面三个例子之间的对比吗?我特别不明白第二个。为了避免复杂化,我在这里使用了'd',在双引号中转义时不会改变含义("\d"="d")。'\\'.tr('\\','x')#=>"x"'\\'.tr('\\d','x')#=>"\\"'\\'.tr('\\\d','x')#=>"x" 最佳答案 在tr中转义tr的第一个参数非常类似于正则表达式中的括号字符分组。您可以在表达式的开头使用^来否定匹配(替换任何不匹配的内容)并使用例如a-f来匹配一
一、离线方式1.1.下载ip2region.xdbGitHub项目地址:https://github.com/lionsoul2014/ip2region我们首先需要下载一个ip2region.xdb的文件下载地址:https://github.com/lionsoul2014/ip2region/blob/master/data/ip2region.xdb打开后点击如图的Download图标即可下载。下载完成后,需要将该文件放到我们的项目中。ps:我是直接放到服务器的,因为放在项目的资源文件夹下,当我们调试的时候使用JavaSpring自带的工具去获取该文件的绝对路径时,没有任何问题,能够正
RubyCompass不工作,代码如下,我已经在网上尝试了10-20种方法,有什么建议吗?在屏幕截图中,您会找到一种更简单的方法来读取我的gem的终端转储和错误,如果您想从那里获取一些东西,您会在屏幕截图下方找到文本谢谢,干杯,罗伯特RubyGemsisasophisticatedpackagemanagerforRuby.Thisisabasichelpmessagecontainingpointerstomoreinformation.Usage:gem-h/--helpgem-v/--versiongemcommand[arguments...][options...]Examp
当我使用Thread.new{}生成一个线程时,该线程中发生的任何异常似乎永远不会出现,应用程序只是悄悄地忽略它 最佳答案 通常情况下,线程是相互隔离的,因此一个线程中的异常不会终止整个应用程序。但是,虽然我从未使用过它们,但Thread类有几个abort_on_exception方法,甚至还有一些示例。他们应该做你想做的事。http://corelib.rubyonrails.org/classes/Thread.html 关于ruby-我如何让ruby在线程内输出异常?,我们在S
所以,我正在用一种enzyme(出于好奇,Asp-N)消化蛋白质序列,这种enzyme在单字母编码序列中由B或D编码的蛋白质之前切割。我的实际分析使用String#scan进行捕获。我试图弄清楚为什么以下正则表达式不能正确消化它...(\w*?)(?=[BD])|(.*\b)前提(.*\b)存在以捕获序列的末尾。对于:MTMDKPSQYDKIEAELQDICNDVLELLDSKGDYFRYLSEVASGDN这应该给出如下内容:[MTM,DKPSQY,DKIEAELQ,DICN,DVLELL,DSKG,...]但会遗漏序列中的每个D。我一直在使用http://www.rubular.co
对于类似Travian的在线策略游戏,我有一些(我认为)非常棒的想法。有些内容我还没有想通,还有一些我还不知道的挑战。这是一个相当大的项目,对于(还)不是熟练的Web开发人员的人来说可能太重了。我还是想试一试,但我在选择平台时遇到了麻烦。世界上的“规模”最近被抛得一团糟,我看到RubyonRails因规模不佳而受到抨击,所以我来这里是为了得到一些答案。我喜欢RubyonRails,无论是Ruby还是Rails。我当然不是这方面的专家,但我喜欢使用它。我之前也使用过Python+Django,也使用过PHP(我不喜欢它。)理想情况下,假设每个服务器有7000名玩家,大概每秒要处理大量数据
当我有一个很长的正则表达式时,比如cucumber步骤定义,最好的换行方式是什么?例如,我想要这样的东西:When/^Ihaveaverylongstepdefinitionhereinmystepdefinitionfile$/do...end分成两行(这行不通:)When/^Ihaveaverylongstepdefinitionherein/\/mystepdefinitionfile$/do...end2018年更新如果您专门来这里吃cucumber,请使用cucumberexpressions是正则表达式的一个很好的替代品 最佳答案
量化交易-因子有效性分析一、因子的IC分析2.信息系数3.举例4.因子处理4.1去极值4.2标准化4.3市值中性化一、因子的IC分析判断因子与收益的相关性强度分析结果因子平均收益ICmeanICstdIC>0.02:IC大约0.02的比例,越大越严格IR:信息比率(历史表现的稳定性),IR=ICmean/ICstd2.信息系数定义:某一期的IC指的是该期因子暴露度和股票下期的实际回报值在横截面上的相关系数。因子暴露度:因子本身数值周期一天:该期的因子值(2023.1.11)、下期(2023.1.12)收益率(截面数据)计算方式:斯皮尔曼相关系数(RankIC)斯皮尔曼相关系数表明X(独立变量)
假设foo、bar和baz没有定义,行foobarbaz引发此错误:NameError(main:Object的未定义局部变量或方法“baz”)在Python、PHP和Javascript的REPL中,foo(bar(baz))中的第一个问题是未定义foo。为什么Ruby首先提示baz? 最佳答案 Ruby允许调用的第一个方法(baz)动态定义其他两个方法。在实际方法调用发生之前,它不会尝试将foo或bar解析为方法调用,并且它永远不会作为baz到达该方法调用首先导致错误。如果baz动态定义方法foo和bar,没有问题:defbaz
如何在Ruby中使用string.tr将双引号替换为单引号? 最佳答案 'abc"def"ghi'.tr('"',"'")#=>abc'def'ghi 关于ruby-在Ruby中如何使用string.tr将双引号替换为单引号?,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/3860645/