草庐IT

MVPPPPSRGGAAKPGQLGRSLGPLLLLLRPEEP

全部标签

python - 胰蛋白 enzyme 消化(裂解)不能使用正则表达式

我试图用Python编写理论上的蛋白质序列胰蛋白enzyme切割代码。胰蛋白enzyme的切割规则是:在R或K之后,但不在P之前。(即胰蛋白enzyme在每个K或R之后切割(切割)蛋白质序列,除非(K或R)后跟P)。示例:序列MVPPPPSRGGAAKPGQLGRSLGPLLLLLRPEEPEDGDREICSESK的切割(切割)应产生以下4个序列(肽):MVPPPPSRGGAAKPGQLGRSLGPLLLLLRPEEPEDGDREICSESK请注意,第二个肽中的K之后没有切割(因为P在K之后)并且在第三个肽中的R之后没有切割(因为P在R之后)。我用Python编写了这段代码,但效果不佳