Maximal Unique Match (er). Large Sequence간의 효율적인 SequenceAlignment를 위해 TIGR에서 개발한 프로그램.
http://www.tigr.org/software/mummer/
두 유전자 배열안에는 반드시 반복되는 공통된 부분을 갖고 있다는 전제를 하고, 이 부분을 MUM이라 한다.
Approach.
- Find MUMs (suffix tree for two genome sequences).
- find a logest set of MUMs in the increasing order.
- Close the gaps.
- Output entire alignmnet.
Once we got unique matches, we still need to find a set of a longest MUMs typically using LIS method
SuffixTree를 이용하여 빠른 속도로 긴 서열을 매칭시키는 것이 특징이다. 5Mbps 정도의 두 서열을 매치시키는데 13초 정도 걸린다고.
관련 paper