PositionSpecificIteratedBlast [[http://www.ncbi.nlm.nih.gov/BLAST/Blast.cgi?CMD=Web&LAYOUT=TwoWindows&AUTO_FORMAT=Semiauto&ALIGNMENTS=250&ALIGNMENT_VIEW=Pairwise&CLIENT=web&COMPOSITION_BASED_STATISTICS=on&DATABASE=nr&CDD_SEARCH=on&DESCRIPTIONS=500&ENTREZ_QUERY=%28none%29&EXPECT=10&FORMAT_OBJECT=Alignment&FORMAT_TYPE=HTML&I_THRESH=0.005&MATRIX_NAME=BLOSUM62&NCBI_GI=on&PAGE=Proteins&PROGRAM=blastp&RUN_PSIBLAST=on&SERVICE=plain&SET_DEFAULTS.x=36&SET_DEFAULTS.y=5&SHOW_OVERVIEW=on&END_OF_HTTPGET=Yes&SHOW_LINKOUT=yes&GET_SEQUENCE=yes|NCBI PSI-BLAST]] 일반 [[BLAST]]의 기능에 [[Motif]]이나 [[Profile]]의 비교 기능을 추가한 프로그램이다. 즉 PSI-BLAST는 기본적인 BLAST검색을 수행한 후 그 결과를 이용하여 MultipleAlignment를 수행한다. MultipleAlignment 를 통해 PositionSpecificWeightMatrix를 제작하고 이 matrix를 이용하여 다시 BLAST 검색을 수행한다. 즉 일반 검색과 [[Motif]], [[Profile]] 검색을 동시에 수행하게 되는 것이다. PsiBlast 의 큰 장점으로는 [[BLAST]] 프로그램이 검색해 내지 못하는 RemoteHomology Sequence (진화적으로 멀리 떨어져 있는 homolog 서열)를 찾아낼 수 있다는 것이며, 이것은 NucleicAcid 서열 보다 Protein 서열을 찾아내는데 아주 유용하다. PsiBlast 를 사용할 때 이런 장점을 이용하기 위해서는 RemoteHomology 와 Query 사이를 연결해 줄 수 있는 Intermediate Sequence를 DB에 포함시켜야 한다. 보통 내가 찾기를 원하는 서열과 ncbi nr 을 섞어서 DB를 만든후 Query를 던져서 검색한다. 이 경우도 주의할 점은 ncbi nr 을 그냥 사용하면 Iteration 이 될 수록 만들어지는 [[PSSM]] 이 특정 서열로 Bias 될 수 있다는 것이며, 이를 예방하기 위해서 cd-hit과 같은 프로그램으로 redundancy 를 90% 또는 70%의 cutoff 로 줄인 DB를 Intermediate Sequence DB 로 이용한다. 관련스크립트 * [[PsiBlastQuery.rb]]