我正在研究一些类似FASTA的序列(不是FASTA,而是我定义的类似于来自PISCES服务器的一些剔除PDB的序列)。我有一个问题。我有一小部分名为nCatSeq的序列,其中有多个nBasinSeq。我浏览了一个大的PDB文件,我想为每个nCatSeq提取相应的nBasinSeq,而不会在字典中出现冗余。下面给出了执行此操作的代码片段。nCatSeq=item[1][n]+item[1][n+1]+item[1][n+2]+item[1][n+3]nBasinSeq=item[2][n]+item[2][n+1]+item[2][n+2]+item[2][n+3]ifnCatSeqno