SerialAnalysisOfGeneExpression
Gene발현산물인 transcript의 모든 염기서열을 결정하는 대신, 각 transcript에서 이를 대표하는 일부의 염기서열만을 확인함으로써 특정세포나 조직에서 발현되는 유전자의 종류와출현빈도를 알 수 있는 HighThroughPut MolecularBiology 실험방법
원리
- 발현된 transcript를 대표하는 sequence tag (10-14bp)의 작출
- sequence tag가 결합된 concatamer 작출
- concatamer의 염기서열 결정과 데이터분석
SAGE에서 결정한 Gene출현빈도가 cDNA library에서의 출현빈도와 상관관계가 있다는것이 실험적으로 검증되었다. 최근 Polyak등은 SAGE기법을 이용하여 p53-induced Apoptosis에 관여하는 일련의 유전자를 성공적으로 규명한바 있다.
SAGE는 어떤 유전자의 발현에 따르는 downstream 유전자군의 분석을 가능케 하여 본래 유전자의 기능을 유추할 수 있게 할 뿐만 아니라, 미지의 downstream 유전자들을 대량 분리하는 수단으로도 쓰일 수 있다.
여기서 얻게되는 10-14bp의 서열은 거의 Gene specific하다고 할 수 있다. 4^10이 백만이므로, Human Gene이 많아야 10만임을 고려한다면 그럴만도 하다.
바뜨, 단점도 있다.
워낙에 짧은 서열이기 때문에 서열의 정확도가 중요하다. 한문자의 base calling error는 200 bp의 cDNA의 10% base calling error에 비해 현저하게 transcript misidentification하게 될 확률이 높다. (because BLAST)
각 tag를 identification하기 위해서는 Database내에 해당 서열이 있어야 한다.
관련 application
관련기업