BioPythonFaq/Clustering - BioHackersNet

BioPythonFaq about [Clustering]

Contents

Biopython 이용한 K-Means
Pairwise alignment score 의 K-Means

Biopython 이용한 K-Means

Q. Biopython 으로 K-Means clustering 하는 방법은 무엇입니까?

A. Biopython 으로 K-Means clustering 을 하려면 먼저 Numeric Python 이 깔려 있어야 합니다. 그 다음에는 다음과 같은 코드로 가능합니다.

from Bio.Tools.Clustering import kMeans
cluster = kMeans.cluster(vector, k)
print cluster

여기서 vector는 [[2,4], [4,2], [3,5]] 같은 형식의 다차원 배열을 이루는 list 입니다. 그리고, k 는 몇개로 clustering 할 것인가입니다.

Pairwise alignment score 의 K-Means

Q. 원박사님 Programming assignment 2 의 4번에 보면, pairwise alignment 한 것을 가지고 다시 clustering 을 하는 것이 나옵니다. 이것은 DNA microarray 를 위한 특별한 방법인 것입니까? 일반적으로 sequence 50 개에 대해서 clustering 을 한다고 하면, 50개 각각에 대해서 membership 이 나오고, UPGMA 같은 경우는 tree 도 만들어주고 그러는 것으로 알고 있는데, pairwise alignment 의 score 를 가지고 하게 되면 50 에서 2 개 뽑는 조합의 membership 이 나옵니다. 이 두 방법이 서로 활용 용도가 틀린 방법인 것입니까? 아니면 어느 하나가 잘못된 것입니까?