일반 BLAST의 기능에 Motif이나 Profile의 비교 기능을 추가한 프로그램이다. 즉 PSI-BLAST는 기본적인 BLAST검색을 수행한 후 그 결과를 이용하여 MultipleAlignment를 수행한다. MultipleAlignment 를 통해 PositionSpecificWeightMatrix를 제작하고 이 matrix를 이용하여 다시 BLAST 검색을 수행한다. 즉 일반 검색과 Motif, Profile 검색을 동시에 수행하게 되는 것이다.
PsiBlast 의 큰 장점으로는 BLAST 프로그램이 검색해 내지 못하는 RemoteHomology Sequence (진화적으로 멀리 떨어져 있는 homolog 서열)를 찾아낼 수 있다는 것이며, 이것은 NucleicAcid 서열 보다 Protein 서열을 찾아내는데 아주 유용하다.
PsiBlast 를 사용할 때 이런 장점을 이용하기 위해서는 RemoteHomology 와 Query 사이를 연결해 줄 수 있는 Intermediate Sequence를 DB에 포함시켜야 한다. 보통 내가 찾기를 원하는 서열과 ncbi nr 을 섞어서 DB를 만든후 Query를 던져서 검색한다. 이 경우도 주의할 점은 ncbi nr 을 그냥 사용하면 Iteration 이 될 수록 만들어지는 PSSM 이 특정 서열로 Bias 될 수 있다는 것이며, 이를 예방하기 위해서 cd-hit과 같은 프로그램으로 redundancy 를 90% 또는 70%의 cutoff 로 줄인 DB를 Intermediate Sequence DB 로 이용한다.
관련스크립트