PDB (ProteinDataBank) File

텍스트화일로 일반 '메모장'같은 프로그램으로 내용을 볼 수 있다. (다음은 Chymotrypsinogen A를 메모장에서 본 내용. 일부 생략)

Protein에 대한 포괄적인 정보들(누가 만들었고 소스는 뭔지와 레퍼런스, 해상도)

  • HEADER HYDROLASE ZYMOGEN (SERINE PROTEINASE) 01-MAR-75 1CHG 1CHG 3
  • COMPND CHYMOTRYPSINOGEN A 1CHG 4
  • SOURCE COW (BOS TAURUS) 1CHG 5
  • AUTHOR S.T.FREER,J.KRAUT,J.D.ROBERTUS,H.T.WRIGHT, 1CHGD 1
  • AUTHOR 2 N.H.XUONG 1CHGD 2
  • REVDAT 9 27-JAN-84 1CHGH 1 REMARK 1CHGH 1
  • REVDAT 8 30-SEP-83 1CHGG 1 REVDAT 1CHGG 1

Protein의 AminoAcid sequence

  • SEQRES 1 245 CYS GLY VAL PRO ALA ILE GLN PRO VAL LEU SER GLY LEU 1CHG 44
  • SEQRES 2 245 SER ARG ILE VAL ASN GLY GLU GLU ALA VAL PRO GLY SER 1CHG 45
  • SEQRES 3 245 TRP PRO TRP GLN VAL SER LEU GLN ASP LYS THR GLY PHE 1CHG 46
  • SEQRES 4 245 HIS PHE CYS GLY GLY SER LEU ILE ASN GLU ASN TRP VAL 1CHG 47
  • SEQRES 5 245 VAL THR ALA ALA HIS CYS GLY VAL THR THR SER ASP VAL 1CHG 48
  • SEQRES 6 245 VAL VAL ALA GLY GLU PHE ASP GLN GLY SER SER SER GLU 1CHG 49
  • SEQRES 7 245 LYS ILE GLN LYS LEU LYS ILE ALA LYS VAL PHE LYS ASN 1CHG 50
  • SEQRES 8 245 SER LYS TYR ASN SER LEU THR ILE ASN ASN ASP ILE THR 1CHG 51

Protein 2차구조의 정보(α-helix, β-pleated sheat, disulfide bond등)

HELIX Record Format SHEET Record Format TURN Record Fromat

  • HELIX 1 H1 SER 164 TYR 171 1 1CHG 63
  • HELIX 2 H2 VAL 235 ASN 245 1 1CHG 64
  • SHEET 1 A 7 PRO 28 ASP 35 0 1CHG 65
  • SHEET 2 A 7 CYS 42 GLU 49 -1 1CHG 66
  • SHEET 3 A 7 ASN 50 ALA 56 -1 1CHG 67
  • SHEET 4 A 7 ASN 101 THR 110 -1 1CHG 68
  • SSBOND 1 CYS 1 CYS 122 1CHGC 48
  • SSBOND 2 CYS 42 CYS 58 1CHGC 49

3차구조로서 각 원자들의 위치를 표시

  • CRYST1 52.000 63.900 77.100 90.00 90.00 90.00 P 21 21 21 4 1CHG 79
  • ORIGX1 -.010366 -1.000128 -.008555 -45.986396 1CHG 80
  • ORIGX2 1.028474 .010623 .004457 44.328913 1CHG 81
  • ORIGX3 -.004252 .008427 -.999992 -35.810671 1CHG 82
  • SCALE1 .000199 -.018701 .000082 .793122 1CHGE 7
  • SCALE2 -.015648 -.000157 .000133 .707859 1CHGE 8
  • SCALE3 -.000110 -.000055 -.012970 .467076 1CHGE 9
  • ATOM 1 N CYS 1 1.363 32.300 2.661 1.00 0.00 1CHG 86
  • ATOM 2 CA CYS 1 1.745 31.604 3.866 1.00 0.00 1CHG 87
  • ATOM 3 C CYS 1 2.235 32.701 4.867 1.00 0.00 1CHG 88
  • ATOM 4 O CYS 1 2.059 33.902 4.557 1.00 0.00 1CHG 89
  • ATOM 5 CB CYS 1 3.000 30.790 3.475 1.00 0.00 1CHG 90
  • ATOM 6 SG CYS 1 4.281 31.574 2.277 1.00 0.00 1CHG 91
  • ATOM 7 N GLY 2 2.615 32.205 5.965 1.00 0.00 1CHG 92

위의 내용을 살펴보면 컴퓨터에서 나타낼 분자구조를 각각 분자대로 표시하고 있다. 먼저 단백질에 대한 포괄적인 정보들(누가 만들었고 소스는 뭔지와 레퍼런스, 해상도)과 sequence, α-helix, β-pleated sheet에 대한 정보, 마지막으로 각 원자들의 3차원위치에 대한 정보들로 이루워져 있음을 알 수 있다.

위 파일을 메모장이 아닌 3차구조 viewer program (Chime, RasMol등)을 사용하면 3차구조를 바로 볼 수 있다. 그러면 프로그램이 각 원자의 좌표를 읽어들이고 그것을 바탕으로 분자구조를 디스플레이상에 된다. 따라서 분자구조 비주얼 프로그램은 단순히 아미노산서열을 입력해서 자신이 최적 구조를 만들어 내는 것이 아니라 위 처럼 이미 구조계산이 끝난 파일들을 읽어들일 뿐이다.


BiomoleculeStructureAnalysis

PdbFormat (last edited 2012-08-09 15:40:42 by 211)

web biohackers.net