Re..Iterator에 대해 기본적으로 Biopython에서 사용하는 flatfile parsing방법은 모두 유사합니다.
한가지 파싱하는법만 좀 익히시면, 다른것들도 비슷하기 때문에 별 어려움이 없으실껍니다.
하나 이상의 gene 레코드를 포함하고 있는 flatfile 을 생각해보세요
레코드가 여러개이기때문에 다음레코드, 다음레코드로 전환해가면서 무언가 작업을 하겠죠
그래서 반복문안에서 다음레코드로~ 라는 의미로 iterator가 쓰여집니다.
다음레코드로~ 의 명령을 내리려면,
지금 작업하고자하는 파일이 어떤것인지 (gb_handle)
Parsing은 어떤 방식으로 할것인지 (feature_parser)
가 있어야 하는거죠...
Parsing에 관한 내용은 http://biohackers.net/wiki/Parsing 의 내용을 참고하시고요..
위에서 파서는 어떻게 문서의 내용을 읽을껀가를 규칙화한것입니다.
보통 biopython에선 두가지 파서가 있죠 레코드파서, 시퀀스파서... 각각 flatfile을 읽고자
접근하는 방법이 틀립니다.
위에서 실제, 다음레코드로~ 의 명령은 next라는 메쏘드가 하게됩니다.
용법을 어디서 찾으시는게 좋을까나...
http://biohackers.net/wiki/FastaFormat 페이지에 보면, 좀 비슷한 내용이 있고...
http://biohackers.net/wiki/BioPythonTip/GenBank 도 좀 비슷하게 설명하고 있습니다.
그 튜토리얼에 있는 내용만한 설명있는곳은 없을듯 -_-
|