ProteinStructure를 이루는 뼈대. ProteinFamily들은 이것을 공유한다.

어떤 ConsensusSequence 중에 보이는 패턴이 그 consensus를 구축하는 근원이 된 서열군이 갖는 기능을 대표하고 있는 경우가 많다. 기능을 담당하고 있는 영역은 [Evolution]의 과정에서 변화를 받지 않고 보존되는 경향이 있기 때문아다. 이러한 서열의 패턴을 Motif 라고 부른다. 어떤 Motif 가 기능 미지의 서열에서 발견된다면, 그 서열은 발견된 Motif 가 대표하는 유전자군과 같은 기능을 갖는다고 추측할 수 있다. 대표적인 Motif Database로는 [PROSITE] 가 있고 GenomNet 등 많은 서버에서 검색할 수 있다.

In ComputerScience terms, a pattern is a set of objects(characters, NucleicAcid, AminoAcid) with some recognizable property. In [Biology], especially for patterns in [Protein] sequences

Why [Motif]?

  • Motifs are the partial regions of sequences which have higher significance than other regions.
  • Motifs are usually the aligned regions in MultipleAlignment.

  • Biologically, motifs consist of the conserved residues in [Protein].
  • Also, signals in NucleicAcid sequences, such as [Promoter]s and binding sites, can considered in the same manner.

  • SequenceAlignment is mainly the alignment between these motifs.

  • Motifs are sometimes used [Metaphor] for the elements in the PeriodicTable in chemistry.

How to construct motifs

Method for modeling motifs

찾는방법

  1. PositionSpecificWeightMatrix를 만든다.

  2. AminoAcid가중치로 나누고 background frequency를 제거

  3. logarithm (LogOddsRatio)