我刚开始学习python,这里有一个排序的蛋白质序列列表(总共59,000个序列),其中一些是重叠的。例如,我在这里做了一个玩具list:ABCDEABCDEFGABCDEFGHABCDEFGHIJKLMNOCESTDBTSFDEDBTSFDEOEOEUDNBNUWEOEUDNBNUWDEAEUDNBNUWFEOEUDNBNUWFGFGH我想删除那些较短的重叠并只保留最长的重叠,以便所需的输出如下所示:ABCDEFGHIJKLMNOCESTDBTSFDEOEAEUDNBNUWFEOEUDNBNUWDFGH我该怎么做?我的代码如下所示:withopen('toy.txt','r')asf
我刚开始学习python,这里有一个排序的蛋白质序列列表(总共59,000个序列),其中一些是重叠的。例如,我在这里做了一个玩具list:ABCDEABCDEFGABCDEFGHABCDEFGHIJKLMNOCESTDBTSFDEDBTSFDEOEOEUDNBNUWEOEUDNBNUWDEAEUDNBNUWFEOEUDNBNUWFGFGH我想删除那些较短的重叠并只保留最长的重叠,以便所需的输出如下所示:ABCDEFGHIJKLMNOCESTDBTSFDEOEAEUDNBNUWFEOEUDNBNUWDFGH我该怎么做?我的代码如下所示:withopen('toy.txt','r')asf