Differences between revisions 5 and 6
Revision 5 as of 2011-08-03 11:00:54
Size: 1988
Editor: localhost
Comment: converted to 1.6 markup
Revision 6 as of 2013-08-07 13:49:07
Size: 2004
Editor: 61
Comment:
Deletions are marked like this. Additions are marked like this.
Line 5: Line 5:
일반 [BLAST]의 기능에 [Motif]이나 [Profile]의 비교 기능을 추가한 프로그램이다. 즉 PSI-BLAST는 기본적인 BLAST검색을 수행한 후 그 결과를 이용하여 MultipleAlignment를 수행한다. MultipleAlignment 를 통해 PositionSpecificWeightMatrix를 제작하고 이 matrix를 이용하여 다시 BLAST 검색을 수행한다. 즉 일반 검색과 [Motif], [Profile] 검색을 동시에 수행하게 되는 것이다. 일반 [[BLAST]]의 기능에 [[Motif]]이나 [[Profile]]의 비교 기능을 추가한 프로그램이다. 즉 PSI-BLAST는 기본적인 BLAST검색을 수행한 후 그 결과를 이용하여 MultipleAlignment를 수행한다. MultipleAlignment 를 통해 PositionSpecificWeightMatrix를 제작하고 이 matrix를 이용하여 다시 BLAST 검색을 수행한다. 즉 일반 검색과 [[Motif]], [[Profile]] 검색을 동시에 수행하게 되는 것이다.
Line 7: Line 7:
PsiBlast 의 큰 장점으로는 [BLAST] 프로그램이 검색해 내지 못하는 RemoteHomology Sequence (진화적으로 멀리 떨어져 있는 homolog 서열)를 찾아낼 수 있다는 것이며, 이것은 NucleicAcid 서열 보다 Protein 서열을 찾아내는데 아주 유용하다. PsiBlast 의 큰 장점으로는 [[BLAST]] 프로그램이 검색해 내지 못하는 RemoteHomology Sequence (진화적으로 멀리 떨어져 있는 homolog 서열)를 찾아낼 수 있다는 것이며, 이것은 NucleicAcid 서열 보다 Protein 서열을 찾아내는데 아주 유용하다.
Line 9: Line 9:
PsiBlast 를 사용할 때 이런 장점을 이용하기 위해서는 RemoteHomology 와 Query 사이를 연결해 줄 수 있는 Intermediate Sequence를 DB에 포함시켜야 한다. 보통 내가 찾기를 원하는 서열과 ncbi nr 을 섞어서 DB를 만든후 Query를 던져서 검색한다. 이 경우도 주의할 점은 ncbi nr 을 그냥 사용하면 Iteration 이 될 수록 만들어지는 [PSSM] 이 특정 서열로 Bias 될 수 있다는 것이며, 이를 예방하기 위해서 cd-hit과 같은 프로그램으로 redundancy 를 90% 또는 70%의 cutoff 로 줄인 DB를 Intermediate Sequence DB 로 이용한다. PsiBlast 를 사용할 때 이런 장점을 이용하기 위해서는 RemoteHomology 와 Query 사이를 연결해 줄 수 있는 Intermediate Sequence를 DB에 포함시켜야 한다. 보통 내가 찾기를 원하는 서열과 ncbi nr 을 섞어서 DB를 만든후 Query를 던져서 검색한다. 이 경우도 주의할 점은 ncbi nr 을 그냥 사용하면 Iteration 이 될 수록 만들어지는 [[PSSM]] 이 특정 서열로 Bias 될 수 있다는 것이며, 이를 예방하기 위해서 cd-hit과 같은 프로그램으로 redundancy 를 90% 또는 70%의 cutoff 로 줄인 DB를 Intermediate Sequence DB 로 이용한다.
Line 12: Line 12:
 * [PsiBlastQuery.rb]  * [[PsiBlastQuery.rb]]

PositionSpecificIteratedBlast

NCBI PSI-BLAST

일반 BLAST의 기능에 Motif이나 Profile의 비교 기능을 추가한 프로그램이다. 즉 PSI-BLAST는 기본적인 BLAST검색을 수행한 후 그 결과를 이용하여 MultipleAlignment를 수행한다. MultipleAlignment 를 통해 PositionSpecificWeightMatrix를 제작하고 이 matrix를 이용하여 다시 BLAST 검색을 수행한다. 즉 일반 검색과 Motif, Profile 검색을 동시에 수행하게 되는 것이다.

PsiBlast 의 큰 장점으로는 BLAST 프로그램이 검색해 내지 못하는 RemoteHomology Sequence (진화적으로 멀리 떨어져 있는 homolog 서열)를 찾아낼 수 있다는 것이며, 이것은 NucleicAcid 서열 보다 Protein 서열을 찾아내는데 아주 유용하다.

PsiBlast 를 사용할 때 이런 장점을 이용하기 위해서는 RemoteHomology 와 Query 사이를 연결해 줄 수 있는 Intermediate Sequence를 DB에 포함시켜야 한다. 보통 내가 찾기를 원하는 서열과 ncbi nr 을 섞어서 DB를 만든후 Query를 던져서 검색한다. 이 경우도 주의할 점은 ncbi nr 을 그냥 사용하면 Iteration 이 될 수록 만들어지는 PSSM 이 특정 서열로 Bias 될 수 있다는 것이며, 이를 예방하기 위해서 cd-hit과 같은 프로그램으로 redundancy 를 90% 또는 70%의 cutoff 로 줄인 DB를 Intermediate Sequence DB 로 이용한다.

관련스크립트

PsiBlast (last edited 2013-08-07 13:49:07 by 61)

web biohackers.net