Size: 1988
Comment: converted to 1.6 markup
|
← Revision 6 as of 2013-08-07 13:49:07 ⇥
Size: 2004
Comment:
|
Deletions are marked like this. | Additions are marked like this. |
Line 5: | Line 5: |
일반 [BLAST]의 기능에 [Motif]이나 [Profile]의 비교 기능을 추가한 프로그램이다. 즉 PSI-BLAST는 기본적인 BLAST검색을 수행한 후 그 결과를 이용하여 MultipleAlignment를 수행한다. MultipleAlignment 를 통해 PositionSpecificWeightMatrix를 제작하고 이 matrix를 이용하여 다시 BLAST 검색을 수행한다. 즉 일반 검색과 [Motif], [Profile] 검색을 동시에 수행하게 되는 것이다. | 일반 [[BLAST]]의 기능에 [[Motif]]이나 [[Profile]]의 비교 기능을 추가한 프로그램이다. 즉 PSI-BLAST는 기본적인 BLAST검색을 수행한 후 그 결과를 이용하여 MultipleAlignment를 수행한다. MultipleAlignment 를 통해 PositionSpecificWeightMatrix를 제작하고 이 matrix를 이용하여 다시 BLAST 검색을 수행한다. 즉 일반 검색과 [[Motif]], [[Profile]] 검색을 동시에 수행하게 되는 것이다. |
Line 7: | Line 7: |
PsiBlast 의 큰 장점으로는 [BLAST] 프로그램이 검색해 내지 못하는 RemoteHomology Sequence (진화적으로 멀리 떨어져 있는 homolog 서열)를 찾아낼 수 있다는 것이며, 이것은 NucleicAcid 서열 보다 Protein 서열을 찾아내는데 아주 유용하다. | PsiBlast 의 큰 장점으로는 [[BLAST]] 프로그램이 검색해 내지 못하는 RemoteHomology Sequence (진화적으로 멀리 떨어져 있는 homolog 서열)를 찾아낼 수 있다는 것이며, 이것은 NucleicAcid 서열 보다 Protein 서열을 찾아내는데 아주 유용하다. |
Line 9: | Line 9: |
PsiBlast 를 사용할 때 이런 장점을 이용하기 위해서는 RemoteHomology 와 Query 사이를 연결해 줄 수 있는 Intermediate Sequence를 DB에 포함시켜야 한다. 보통 내가 찾기를 원하는 서열과 ncbi nr 을 섞어서 DB를 만든후 Query를 던져서 검색한다. 이 경우도 주의할 점은 ncbi nr 을 그냥 사용하면 Iteration 이 될 수록 만들어지는 [PSSM] 이 특정 서열로 Bias 될 수 있다는 것이며, 이를 예방하기 위해서 cd-hit과 같은 프로그램으로 redundancy 를 90% 또는 70%의 cutoff 로 줄인 DB를 Intermediate Sequence DB 로 이용한다. | PsiBlast 를 사용할 때 이런 장점을 이용하기 위해서는 RemoteHomology 와 Query 사이를 연결해 줄 수 있는 Intermediate Sequence를 DB에 포함시켜야 한다. 보통 내가 찾기를 원하는 서열과 ncbi nr 을 섞어서 DB를 만든후 Query를 던져서 검색한다. 이 경우도 주의할 점은 ncbi nr 을 그냥 사용하면 Iteration 이 될 수록 만들어지는 [[PSSM]] 이 특정 서열로 Bias 될 수 있다는 것이며, 이를 예방하기 위해서 cd-hit과 같은 프로그램으로 redundancy 를 90% 또는 70%의 cutoff 로 줄인 DB를 Intermediate Sequence DB 로 이용한다. |
Line 12: | Line 12: |
* [PsiBlastQuery.rb] | * [[PsiBlastQuery.rb]] |
일반 BLAST의 기능에 Motif이나 Profile의 비교 기능을 추가한 프로그램이다. 즉 PSI-BLAST는 기본적인 BLAST검색을 수행한 후 그 결과를 이용하여 MultipleAlignment를 수행한다. MultipleAlignment 를 통해 PositionSpecificWeightMatrix를 제작하고 이 matrix를 이용하여 다시 BLAST 검색을 수행한다. 즉 일반 검색과 Motif, Profile 검색을 동시에 수행하게 되는 것이다.
PsiBlast 의 큰 장점으로는 BLAST 프로그램이 검색해 내지 못하는 RemoteHomology Sequence (진화적으로 멀리 떨어져 있는 homolog 서열)를 찾아낼 수 있다는 것이며, 이것은 NucleicAcid 서열 보다 Protein 서열을 찾아내는데 아주 유용하다.
PsiBlast 를 사용할 때 이런 장점을 이용하기 위해서는 RemoteHomology 와 Query 사이를 연결해 줄 수 있는 Intermediate Sequence를 DB에 포함시켜야 한다. 보통 내가 찾기를 원하는 서열과 ncbi nr 을 섞어서 DB를 만든후 Query를 던져서 검색한다. 이 경우도 주의할 점은 ncbi nr 을 그냥 사용하면 Iteration 이 될 수록 만들어지는 PSSM 이 특정 서열로 Bias 될 수 있다는 것이며, 이를 예방하기 위해서 cd-hit과 같은 프로그램으로 redundancy 를 90% 또는 70%의 cutoff 로 줄인 DB를 Intermediate Sequence DB 로 이용한다.
관련스크립트