Differences between revisions 4 and 6 (spanning 2 versions)
Revision 4 as of 2006-07-07 14:12:23
Size: 1986
Editor: 203
Comment:
Revision 6 as of 2013-08-07 13:49:07
Size: 2004
Editor: 61
Comment:
Deletions are marked like this. Additions are marked like this.
Line 3: Line 3:
[http://www.ncbi.nlm.nih.gov/BLAST/Blast.cgi?CMD=Web&LAYOUT=TwoWindows&AUTO_FORMAT=Semiauto&ALIGNMENTS=250&ALIGNMENT_VIEW=Pairwise&CLIENT=web&COMPOSITION_BASED_STATISTICS=on&DATABASE=nr&CDD_SEARCH=on&DESCRIPTIONS=500&ENTREZ_QUERY=%28none%29&EXPECT=10&FORMAT_OBJECT=Alignment&FORMAT_TYPE=HTML&I_THRESH=0.005&MATRIX_NAME=BLOSUM62&NCBI_GI=on&PAGE=Proteins&PROGRAM=blastp&RUN_PSIBLAST=on&SERVICE=plain&SET_DEFAULTS.x=36&SET_DEFAULTS.y=5&SHOW_OVERVIEW=on&END_OF_HTTPGET=Yes&SHOW_LINKOUT=yes&GET_SEQUENCE=yes NCBI PSI-BLAST] [[http://www.ncbi.nlm.nih.gov/BLAST/Blast.cgi?CMD=Web&LAYOUT=TwoWindows&AUTO_FORMAT=Semiauto&ALIGNMENTS=250&ALIGNMENT_VIEW=Pairwise&CLIENT=web&COMPOSITION_BASED_STATISTICS=on&DATABASE=nr&CDD_SEARCH=on&DESCRIPTIONS=500&ENTREZ_QUERY=%28none%29&EXPECT=10&FORMAT_OBJECT=Alignment&FORMAT_TYPE=HTML&I_THRESH=0.005&MATRIX_NAME=BLOSUM62&NCBI_GI=on&PAGE=Proteins&PROGRAM=blastp&RUN_PSIBLAST=on&SERVICE=plain&SET_DEFAULTS.x=36&SET_DEFAULTS.y=5&SHOW_OVERVIEW=on&END_OF_HTTPGET=Yes&SHOW_LINKOUT=yes&GET_SEQUENCE=yes|NCBI PSI-BLAST]]
Line 5: Line 5:
일반 [BLAST]의 기능에 [Motif]이나 [Profile]의 비교 기능을 추가한 프로그램이다. 즉 PSI-BLAST는 기본적인 BLAST검색을 수행한 후 그 결과를 이용하여 MultipleAlignment를 수행한다. MultipleAlignment 를 통해 PositionSpecificWeightMatrix를 제작하고 이 matrix를 이용하여 다시 BLAST 검색을 수행한다. 즉 일반 검색과 [Motif], [Profile] 검색을 동시에 수행하게 되는 것이다. 일반 [[BLAST]]의 기능에 [[Motif]]이나 [[Profile]]의 비교 기능을 추가한 프로그램이다. 즉 PSI-BLAST는 기본적인 BLAST검색을 수행한 후 그 결과를 이용하여 MultipleAlignment를 수행한다. MultipleAlignment 를 통해 PositionSpecificWeightMatrix를 제작하고 이 matrix를 이용하여 다시 BLAST 검색을 수행한다. 즉 일반 검색과 [[Motif]], [[Profile]] 검색을 동시에 수행하게 되는 것이다.
Line 7: Line 7:
PsiBlast 의 큰 장점으로는 [BLAST] 프로그램이 검색해 내지 못하는 RemoteHomology Sequence (진화적으로 멀리 떨어져 있는 homolog 서열)를 찾아낼 수 있다는 것이며, 이것은 NucleicAcid 서열 보다 Protein 서열을 찾아내는데 아주 유용하다. PsiBlast 의 큰 장점으로는 [[BLAST]] 프로그램이 검색해 내지 못하는 RemoteHomology Sequence (진화적으로 멀리 떨어져 있는 homolog 서열)를 찾아낼 수 있다는 것이며, 이것은 NucleicAcid 서열 보다 Protein 서열을 찾아내는데 아주 유용하다.
Line 9: Line 9:
PsiBlast 를 사용할 때 이런 장점을 이용하기 위해서는 RemoteHomology 와 Query 사이를 연결해 줄 수 있는 Intermediate Sequence를 DB에 포함시켜야 한다. 보통 내가 찾기를 원하는 서열과 ncbi nr 을 섞어서 DB를 만든후 Query를 던져서 검색한다. 이 경우도 주의할 점은 ncbi nr 을 그냥 사용하면 Iteration 이 될 수록 만들어지는 [PSSM] 이 특정 서열로 Bias 될 수 있다는 것이며, 이를 예방하기 위해서 cd-hit과 같은 프로그램으로 redundancy 를 90% 또는 70%의 cutoff 로 줄인 DB를 Intermediate Sequence DB 로 이용한다. PsiBlast 를 사용할 때 이런 장점을 이용하기 위해서는 RemoteHomology 와 Query 사이를 연결해 줄 수 있는 Intermediate Sequence를 DB에 포함시켜야 한다. 보통 내가 찾기를 원하는 서열과 ncbi nr 을 섞어서 DB를 만든후 Query를 던져서 검색한다. 이 경우도 주의할 점은 ncbi nr 을 그냥 사용하면 Iteration 이 될 수록 만들어지는 [[PSSM]] 이 특정 서열로 Bias 될 수 있다는 것이며, 이를 예방하기 위해서 cd-hit과 같은 프로그램으로 redundancy 를 90% 또는 70%의 cutoff 로 줄인 DB를 Intermediate Sequence DB 로 이용한다.
Line 12: Line 12:
 * [PsiBlastQuery.rb]  * [[PsiBlastQuery.rb]]

PositionSpecificIteratedBlast

NCBI PSI-BLAST

일반 BLAST의 기능에 Motif이나 Profile의 비교 기능을 추가한 프로그램이다. 즉 PSI-BLAST는 기본적인 BLAST검색을 수행한 후 그 결과를 이용하여 MultipleAlignment를 수행한다. MultipleAlignment 를 통해 PositionSpecificWeightMatrix를 제작하고 이 matrix를 이용하여 다시 BLAST 검색을 수행한다. 즉 일반 검색과 Motif, Profile 검색을 동시에 수행하게 되는 것이다.

PsiBlast 의 큰 장점으로는 BLAST 프로그램이 검색해 내지 못하는 RemoteHomology Sequence (진화적으로 멀리 떨어져 있는 homolog 서열)를 찾아낼 수 있다는 것이며, 이것은 NucleicAcid 서열 보다 Protein 서열을 찾아내는데 아주 유용하다.

PsiBlast 를 사용할 때 이런 장점을 이용하기 위해서는 RemoteHomology 와 Query 사이를 연결해 줄 수 있는 Intermediate Sequence를 DB에 포함시켜야 한다. 보통 내가 찾기를 원하는 서열과 ncbi nr 을 섞어서 DB를 만든후 Query를 던져서 검색한다. 이 경우도 주의할 점은 ncbi nr 을 그냥 사용하면 Iteration 이 될 수록 만들어지는 PSSM 이 특정 서열로 Bias 될 수 있다는 것이며, 이를 예방하기 위해서 cd-hit과 같은 프로그램으로 redundancy 를 90% 또는 70%의 cutoff 로 줄인 DB를 Intermediate Sequence DB 로 이용한다.

관련스크립트

PsiBlast (last edited 2013-08-07 13:49:07 by 61)

web biohackers.net