BioPython과 GnuPlotPy를 이용한 간단한 서열분석 통계프로그램.
- (아직 뭐 통계란 말 쓰긴 좀 뭣하지만, 암튼...)
CVS에 올렸습니다. 관심있으신분들의 많은 참여를 바랍니다. 커밋을 원하시면 yong27에게 말씀주세요. 계정드립니다.
Contents |
목적 및 방향
각종 BiologicalSequenceAnalysis시 좀더 사용자 친숙한 graphic data representation을 실현한다.
가능한한 BioPython을 이용하여, BioPython의 활용도를 높히며, BioPython발전에 기여한다.
가능한한 ExtremeProgramming의 방법을 이용한다.
Discussion
랜덤서열과 실제서열의 AminoAcid조성분포 그림에서, Random 서열의 분포가 저렇게 되는 이유는 codon table때문입니다. 특정 AminoAcid를 더 많이 코딩할 기회가 되는 코돈에 의한 AminoAcid빈도가 더 많음은 당연하겠죠. 그래서 저런 그림이 되는데, E.coli와의 비교를 보면 좀 특이합니다. 저 분포의 차이가 어떤 생물학적 의미를 반영하지 않을까 생각됩니다. 종간 차이도 있을까요?
Bacillus, Drosophila, Rattus, Human 을 하나하나 해본결과 특정 Evolution적 연관관계가 있는것으로 여겨진다. Rattus와 Human은 매우 유사한것에 비해, Drosophila순으로 유사함에 차이가 나타난다.
작업로그
sequence length distribution --yong27/2003-05-27
CVS 임포트, AminoAcid composition distribution (GnuPlotPy에서 에러...) --yong27/2003-06-03
AminoAcid composition distribution, PMF AminoAcid length, masses distribution --yong27, 2003-08-18
Random sequence generation 부분 완성 --yong27/2003-08-19
Protein sequence using random dna translation 부분 완성 --yong27, 2003-08-21
본 프로그램은 yong27이 아주 오래전에 만들었던 것으로 현재는 이용할 수 없습니다. -- yong27 2012-06-14 08:49:41