EstClustering으로 ExpressionProfile을 계산

동일종에서 유래한 각기 다른 라이브러리들을 합쳐서 EST Clustering 한 뒤에 각 라이브러리 별로 특정 유전자(contig)의 발현빈도를 계산하는 방법

$$ R_j = \sum_{i=1}^m x_{ij} \log \frac{x_{ij}}{N_i f_j} $$
$$ f_j = \frac{\sum_{i=1}^m x_{ij}}{\sum_{i=1}^m N_i} $$

Symbols description

  • m : number of cDNA libraries

  • xij : number of transcript(est) copies of gene(contig) j in the i th library

  • Ni : total number of cDNA clones sequenced in the i th library

  • fj : frequency of gene transcript copies of gene j in all the libraries

Python script Include(ExpressionProfileByEstClustering.py)

web biohackers.net