BioPython과 GnuPlotPy를 이용한 간단한 서열분석 통계프로그램. (아직 뭐 통계란 말 쓰긴 좀 뭣하지만, 암튼...) [[CVS]]에 올렸습니다. 관심있으신분들의 많은 참여를 바랍니다. 커밋을 원하시면 [[yong27]]에게 말씀주세요. 계정드립니다. ViewCvs:BioSeqStat ||<>|| == 목적 및 방향 == * 각종 BiologicalSequenceAnalysis시 좀더 사용자 친숙한 graphic data representation을 실현한다. * 가능한한 BioPython을 이용하여, BioPython의 활용도를 높히며, BioPython발전에 기여한다. * 가능한한 ExtremeProgramming의 방법을 이용한다. SeeAlso PmfSimulation == Discussion == 랜덤서열과 실제서열의 AminoAcid조성분포 그림에서, Random 서열의 분포가 저렇게 되는 이유는 codon table때문입니다. 특정 AminoAcid를 더 많이 코딩할 기회가 되는 코돈에 의한 AminoAcid빈도가 더 많음은 당연하겠죠. 그래서 저런 그림이 되는데, E.coli와의 비교를 보면 좀 특이합니다. 저 분포의 차이가 어떤 생물학적 의미를 반영하지 않을까 생각됩니다. 종간 차이도 있을까요? Bacillus, Drosophila, Rattus, Human 을 하나하나 해본결과 특정 [[Evolution]]적 연관관계가 있는것으로 여겨진다. Rattus와 Human은 매우 유사한것에 비해, Drosophila순으로 유사함에 차이가 나타난다. == 작업로그 == * sequence length distribution --[[yong27/2003-05]]-27 * [[CVS]] 임포트, AminoAcid composition distribution (GnuPlotPy에서 에러...) --[[yong27/2003-06]]-03 * AminoAcid composition distribution, [[PMF]] AminoAcid length, masses distribution --[[yong27]], 2003-08-18 * Random sequence generation 부분 완성 --[[yong27/2003-08]]-19 * Protein sequence using random dna translation 부분 완성 --[[yong27]], 2003-08-21 ---- 본 프로그램은 [[yong27]]이 아주 오래전에 만들었던 것으로 현재는 이용할 수 없습니다. -- [[yong27]] <> ---- CategoryProgramLibrary