我正在用Python编写一个简短的程序来读取FASTA文件,该文件通常采用以下格式:
>gi|253795547|ref|NC_012960.1| Candidatus Hodgkinia cicadicola Dsem chromosome,52 lines
GACGGCTTGTTTGCGTGCGACGAGTTTAGGATTGCTCTTTTGCTAAGCTTGGGGGTTGCGCCCAAAGTGA
TTAGATTTTCCGACAGCGTACGGCGCGCGCTGCTGAACGTGGCCACTGAGCTTACACCTCATTTCAGCGC
TCGCTTGCTGGCGAAGCTGGCAGCAGCTTGTTAATGCTAGTGTTGGGCTCGCCGAAAGCTGGCAGGTCGA
我已经创建了另一个程序来读取这个FASTA文件的第一行(又名标题),现在我希望第二个程序从序列开始读取和打印.
我该怎么办?
到目前为止我有这个:
FASTA = open("test.txt","r")
def readSeq(FASTA):
"""returns the DNA sequence of a FASTA file"""
for line in FASTA:
line = line.strip()
print line
readSeq(FASTA)
多谢你们
-菜鸟
最佳答案
def readSeq(FASTA):
"""returns the DNA sequence of a FASTA file"""
_unused = FASTA.next() # skip heading record
for line in FASTA:
line = line.strip()
print line
阅读the docs on file.next()以了解为什么你应该警惕将file.readline()与for file in file混合: