몇몇 포유류의 [[Mitochondria]] [[DNA]]들을 MultipleAlignment해서, 종 특이 영역 priming할 수 있는 PrimerDesign을 하려고 한다. || '''종''' || '''영문''' || '''학명(속,종)''' || '''RefSeq id''' || || 닭 || chicken || ''Callus gallus'' || RefSeq:NC_001323 || || 소 || cow || ''Bos taurus'' || RefSeq:NC_001567 || || 돼지 || pig || ''Sus scrofa'' || RefSeq:NC_000845 || || 말 || horse || ''Equus caballus'' || RefSeq:NC_001640 || || 염소 || goat || ''Capra hircus'' || RefSeq:NC_005044 || || 양 || sheep || ''Ovis aries'' || RefSeq:NC_001941 || || 개 || dog || ''Canis familiaris'' || RefSeq:NC_002008 || || 사슴 || deer || ''Muntiacus muntjak'' || RefSeq:NC_004563 || 서열획득스크립트 {{{#!python from Bio import GenBank, Fasta gis={ 'chicken' : 'NC_001323', 'cow' : 'NC_001567', 'pig' : 'NC_000845', 'horse' : 'NC_001640', 'goat' : 'NC_001640', 'sheep' : 'NC_001941', 'dog' : 'NC_002008', 'deer' : 'NC_004563', } fpser = GenBank.FeatureParser() ncbi = GenBank.NCBIDictionary('nucleotide','genbank',parser=fpser) def fullGenome(anOutFileName): resultFile = open(anOutFileName,'w') for species in gis: genome = ncbi[gis[species]] fasta = Fasta.Record() fasta.title = ' '.join([species, genome.name, genome.description]) fasta.sequence = genome.seq.tostring() resultFile.write(str(fasta)+'\n') def rDNA16S(anOutFileName): resultFile = open(anOutFileName,'w') for species in gis: genome = ncbi[gis[species]] for feature in genome.features: product= feature.qualifiers.get('product') if product and product[0].find('16S')>=0: fasta = Fasta.Record() fasta.title = ' '.join([species, genome.name, product[0]]) start = feature.location.start.position end = feature.location.end.position fasta.sequence = genome.seq[start:end].tostring() resultFile.write(str(fasta)+'\n') continue if __name__=='__main__': #fullGenome('mtdna.fasta') rDNA16S('mtdna_16s.fasta') }}} 얻어진 서열을 [[ClustalW]]로 MultipleAlignment하면 MT DNA는 많은 부분 보존되어 있슴을 알 수 있다. 여기서 한가지 궁금증. Circular DNA의 경우, MultipleAlignment을 제대로 하려면, 금고다이얼처럼 맞춰야 할텐데, 그런 옵션이 없다. 구글검색해봐도, 언급이 없다. AnswerMe! 어쩌면 논문등의 NewIdea로 써먹을수도 있을듯. Species specific PrimerDesign은 [[Amplicon]]을 이용해서 해결 전체 [[Genome]]을 이용할 경우, 서열이 너무 커서, 프로그램이 동작하지 않는다. 임시로 16S [[RNA]]영역만을 추출하여 가동. 그럴듯한 결과를 얻을 수 있으나, 다른 영역에서 priming될지도 모른다는 단점을 지닌다.