Size: 3920
Comment:
|
← Revision 4 as of 2012-06-14 08:49:42 ⇥
Size: 2130
Comment:
|
Deletions are marked like this. | Additions are marked like this. |
Line 16: | Line 16: |
== 각종 기능들 == === sequence length distribution === FastaFormat의 다수서열을 입력받아 SlidingWindow방식으로 서열길이분포 그리기. Example (E.coli의 SwissProt 모든 [[Protein]]들 길이분포, window size = 30) Uploads:ecoli_protein_len_dist.png === AminoAcid contents distribution === FastaFormat의 다수서열을 입력받아 각각 AminoAcid의 발생빈도계산. 발생빈도 그래프그리기. Example (E.coli의 SwissProt 모든 [[Protein]들 AminoAcid 발생빈도) Uploads:aadist.png === Pepide length distribution by each protease === FastaFormat의 다수서열을 입력받아 특정 protease에 의해 생성된 펩타이드들의 길이 분포. Example (E.coli의 SwissProt 모든 [[Protein]]들을 Trypsin으로 절단했을때의 길이분포) Uploads:seqlendist_ecoli.png === Peptide masses distribution by each protease === FastaFormat의 다수서열을 입력받아 특정 protease에 의해 생성된 펩타이드들의 질량 분포. Example (E.coli의 SwissProt 모든 [[Protein]]들을 Trypsin으로 절단했을때의 펩타이드 질량분포, SlidingWindow 50적용) Uploads:massdist_ecoli.png |
|
Line 52: | Line 18: |
=== Random generated 서열과 비교기능 === ==== 랜덤서열의 PMF ==== 랜덤서열을 만들고, (길이 100짜리 1000개) 트립신 처리후 펩타이드들의 길이분포 Uploads:random_pmf_dist.png ==== 랜덤서열과 실제서열과의 AminoAcid 조성분포 ==== 랜덤서열 (길이 500짜리 NucleicAcid서열을 standard codon table로 translation, stop codon무시, 1000개) Uploads:aadist_random.png E.coli서열 (SwissProt내 모든 [[Protein]]서열) Uploads:aadist_ecoli.png Bacillus Uploads:aadist_bacillus.png Drosophila Uploads:aadist_drosophila.png Rattus Uploads:aadist_rattus.png Human Uploads:aadist_sapiens.png === Protein hydrophobisity diagram === === GcSkew diagram === |
|
Line 103: | Line 33: |
본 프로그램은 [[yong27]]이 아주 오래전에 만들었던 것으로 현재는 이용할 수 없습니다. -- [[yong27]] <<DateTime(2012-06-14T08:49:41+0900)>> ---- |
BioPython과 GnuPlotPy를 이용한 간단한 서열분석 통계프로그램.
- (아직 뭐 통계란 말 쓰긴 좀 뭣하지만, 암튼...)
CVS에 올렸습니다. 관심있으신분들의 많은 참여를 바랍니다. 커밋을 원하시면 yong27에게 말씀주세요. 계정드립니다.
Contents |
목적 및 방향
각종 BiologicalSequenceAnalysis시 좀더 사용자 친숙한 graphic data representation을 실현한다.
가능한한 BioPython을 이용하여, BioPython의 활용도를 높히며, BioPython발전에 기여한다.
가능한한 ExtremeProgramming의 방법을 이용한다.
Discussion
랜덤서열과 실제서열의 AminoAcid조성분포 그림에서, Random 서열의 분포가 저렇게 되는 이유는 codon table때문입니다. 특정 AminoAcid를 더 많이 코딩할 기회가 되는 코돈에 의한 AminoAcid빈도가 더 많음은 당연하겠죠. 그래서 저런 그림이 되는데, E.coli와의 비교를 보면 좀 특이합니다. 저 분포의 차이가 어떤 생물학적 의미를 반영하지 않을까 생각됩니다. 종간 차이도 있을까요?
Bacillus, Drosophila, Rattus, Human 을 하나하나 해본결과 특정 Evolution적 연관관계가 있는것으로 여겨진다. Rattus와 Human은 매우 유사한것에 비해, Drosophila순으로 유사함에 차이가 나타난다.
작업로그
sequence length distribution --yong27/2003-05-27
CVS 임포트, AminoAcid composition distribution (GnuPlotPy에서 에러...) --yong27/2003-06-03
AminoAcid composition distribution, PMF AminoAcid length, masses distribution --yong27, 2003-08-18
Random sequence generation 부분 완성 --yong27/2003-08-19
Protein sequence using random dna translation 부분 완성 --yong27, 2003-08-21
본 프로그램은 yong27이 아주 오래전에 만들었던 것으로 현재는 이용할 수 없습니다. -- yong27 2012-06-14 08:49:41