![]() ![]() ![]() | |
![]() 한가지 파싱하는법만 좀 익히시면, 다른것들도 비슷하기 때문에 별 어려움이 없으실껍니다. 하나 이상의 gene 레코드를 포함하고 있는 flatfile 을 생각해보세요 레코드가 여러개이기때문에 다음레코드, 다음레코드로 전환해가면서 무언가 작업을 하겠죠 그래서 반복문안에서 다음레코드로~ 라는 의미로 iterator가 쓰여집니다. 다음레코드로~ 의 명령을 내리려면, 지금 작업하고자하는 파일이 어떤것인지 (gb_handle) Parsing은 어떤 방식으로 할것인지 (feature_parser) 가 있어야 하는거죠... Parsing에 관한 내용은 http://biohackers.net/wiki/Parsing 의 내용을 참고하시고요.. 위에서 파서는 어떻게 문서의 내용을 읽을껀가를 규칙화한것입니다. 보통 biopython에선 두가지 파서가 있죠 레코드파서, 시퀀스파서... 각각 flatfile을 읽고자 접근하는 방법이 틀립니다. 위에서 실제, 다음레코드로~ 의 명령은 next라는 메쏘드가 하게됩니다. 용법을 어디서 찾으시는게 좋을까나... http://biohackers.net/wiki/FastaFormat 페이지에 보면, 좀 비슷한 내용이 있고... http://biohackers.net/wiki/BioPythonTip/GenBank 도 좀 비슷하게 설명하고 있습니다. 그 튜토리얼에 있는 내용만한 설명있는곳은 없을듯 -_- |
![]() ![]() ![]() ![]() ![]() ![]() |