OpenReadingFrame

1차원적인 [DNA]서열을 보고, [Protein] 코딩부분을 예측할 수 있다. 여기서의 코딩부분은 start codon 부터 stop codon까지. 이러한 [Protein] 후보 영역들을 OpenReadingFrame [ORF]라고 한다.

일반적으로 같은 stop codon을 사용하나 다른 start codon을 쓰는 많은 overlapping ORF가 있으며, 여기서 Maximal ORF를 ORF라고 칭하기도 한다.

따라서, 하나의 real gene에는 여러개의 ORF가 있을 수 있다. 여기서 non-coding ORF와 real gene를 구분하는 것이 생물정보학적 문제에 해당되며, High order MarkovChain등이 사용된다.

ORF prediction --> GenePrediction

web biohackers.net