ProteinStructure를 이루는 뼈대. ProteinFamily들은 이것을 공유한다. 어떤 ConsensusSequence 중에 보이는 패턴이 그 consensus를 구축하는 근원이 된 서열군이 갖는 기능을 대표하고 있는 경우가 많다. 기능을 담당하고 있는 영역은 [[Evolution]]의 과정에서 변화를 받지 않고 보존되는 경향이 있기 때문아다. 이러한 서열의 패턴을 Motif 라고 부른다. 어떤 Motif 가 기능 미지의 서열에서 발견된다면, 그 서열은 발견된 Motif 가 대표하는 유전자군과 같은 기능을 갖는다고 추측할 수 있다. 대표적인 Motif Database로는 [[PROSITE]] 가 있고 GenomNet 등 많은 서버에서 검색할 수 있다. In ComputerScience terms, a pattern is a set of objects(characters, NucleicAcid, AminoAcid) with some recognizable property. In [[Biology]], especially for patterns in [[Protein]] sequences Why [[Motif]]? * Motifs are the partial regions of sequences which have higher significance than other regions. * Motifs are usually the aligned regions in MultipleAlignment. * Biologically, motifs consist of the conserved residues in [[Protein]]. * Also, signals in NucleicAcid sequences, such as [[Promoter]]s and binding sites, can considered in the same manner. * SequenceAlignment is mainly the alignment between these motifs. * Motifs are sometimes used [[Metaphor]] for the elements in the PeriodicTable in chemistry. How to construct motifs * MultipleAlignment gives a clus. * There are also some methods which don't require these PriorKnowledge. Method for modeling motifs * ConsensusSequence * RegularExpression * Deterministic FiniteStateAutomata * PositionSpecificWeightMatrix * GibbsSampling * HiddenMarkovModel * NeuralNetwork 찾는방법 1. PositionSpecificWeightMatrix를 만든다. 1. AminoAcid가중치로 나누고 background frequency를 제거 1. logarithm (LogOddsRatio)