ProteinStructure를 이루는 뼈대. ProteinFamily들은 이것을 공유한다.

어떤 ConsensusSequence 중에 보이는 패턴이 그 consensus를 구축하는 근원이 된 서열군이 갖는 기능을 대표하고 있는 경우가 많다. 기능을 담당하고 있는 영역은 Evolution의 과정에서 변화를 받지 않고 보존되는 경향이 있기 때문아다. 이러한 서열의 패턴을 Motif 라고 부른다. 어떤 Motif 가 기능 미지의 서열에서 발견된다면, 그 서열은 발견된 Motif 가 대표하는 유전자군과 같은 기능을 갖는다고 추측할 수 있다. 대표적인 Motif Database로는 PROSITE 가 있고 GenomNet 등 많은 서버에서 검색할 수 있다.

In ComputerScience terms, a pattern is a set of objects(characters, NucleicAcid, AminoAcid) with some recognizable property. In Biology, especially for patterns in Protein sequences

Why Motif?

  • Motifs are the partial regions of sequences which have higher significance than other regions.
  • Motifs are usually the aligned regions in MultipleAlignment.

  • Biologically, motifs consist of the conserved residues in Protein.

  • Also, signals in NucleicAcid sequences, such as Promoters and binding sites, can considered in the same manner.

  • SequenceAlignment is mainly the alignment between these motifs.

  • Motifs are sometimes used Metaphor for the elements in the PeriodicTable in chemistry.

How to construct motifs

Method for modeling motifs

찾는방법

  1. PositionSpecificWeightMatrix를 만든다.

  2. AminoAcid가중치로 나누고 background frequency를 제거

  3. logarithm (LogOddsRatio)

Motif (last edited 2011-11-30 18:51:04 by 152)

web biohackers.net