PDB (ProteinDataBank) File
텍스트화일로 일반 '메모장'같은 프로그램으로 내용을 볼 수 있다. (다음은 Chymotrypsinogen A를 메모장에서 본 내용. 일부 생략)
Protein에 대한 포괄적인 정보들(누가 만들었고 소스는 뭔지와 레퍼런스, 해상도)
- HEADER HYDROLASE ZYMOGEN (SERINE PROTEINASE) 01-MAR-75 1CHG 1CHG 3
- COMPND CHYMOTRYPSINOGEN A 1CHG 4
- SOURCE COW (BOS TAURUS) 1CHG 5
- AUTHOR S.T.FREER,J.KRAUT,J.D.ROBERTUS,H.T.WRIGHT, 1CHGD 1
- AUTHOR 2 N.H.XUONG 1CHGD 2
- REVDAT 9 27-JAN-84 1CHGH 1 REMARK 1CHGH 1
- REVDAT 8 30-SEP-83 1CHGG 1 REVDAT 1CHGG 1
Protein의 AminoAcid sequence
- SEQRES 1 245 CYS GLY VAL PRO ALA ILE GLN PRO VAL LEU SER GLY LEU 1CHG 44
- SEQRES 2 245 SER ARG ILE VAL ASN GLY GLU GLU ALA VAL PRO GLY SER 1CHG 45
- SEQRES 3 245 TRP PRO TRP GLN VAL SER LEU GLN ASP LYS THR GLY PHE 1CHG 46
- SEQRES 4 245 HIS PHE CYS GLY GLY SER LEU ILE ASN GLU ASN TRP VAL 1CHG 47
- SEQRES 5 245 VAL THR ALA ALA HIS CYS GLY VAL THR THR SER ASP VAL 1CHG 48
- SEQRES 6 245 VAL VAL ALA GLY GLU PHE ASP GLN GLY SER SER SER GLU 1CHG 49
- SEQRES 7 245 LYS ILE GLN LYS LEU LYS ILE ALA LYS VAL PHE LYS ASN 1CHG 50
- SEQRES 8 245 SER LYS TYR ASN SER LEU THR ILE ASN ASN ASP ILE THR 1CHG 51
Protein 2차구조의 정보(α-helix, β-pleated sheat, disulfide bond등)
HELIX Record Format SHEET Record Format TURN Record Fromat
- HELIX 1 H1 SER 164 TYR 171 1 1CHG 63
- HELIX 2 H2 VAL 235 ASN 245 1 1CHG 64
- SHEET 1 A 7 PRO 28 ASP 35 0 1CHG 65
- SHEET 2 A 7 CYS 42 GLU 49 -1 1CHG 66
- SHEET 3 A 7 ASN 50 ALA 56 -1 1CHG 67
- SHEET 4 A 7 ASN 101 THR 110 -1 1CHG 68
- SSBOND 1 CYS 1 CYS 122 1CHGC 48
- SSBOND 2 CYS 42 CYS 58 1CHGC 49
3차구조로서 각 원자들의 위치를 표시
- CRYST1 52.000 63.900 77.100 90.00 90.00 90.00 P 21 21 21 4 1CHG 79
- ORIGX1 -.010366 -1.000128 -.008555 -45.986396 1CHG 80
- ORIGX2 1.028474 .010623 .004457 44.328913 1CHG 81
- ORIGX3 -.004252 .008427 -.999992 -35.810671 1CHG 82
- SCALE1 .000199 -.018701 .000082 .793122 1CHGE 7
- SCALE2 -.015648 -.000157 .000133 .707859 1CHGE 8
- SCALE3 -.000110 -.000055 -.012970 .467076 1CHGE 9
- ATOM 1 N CYS 1 1.363 32.300 2.661 1.00 0.00 1CHG 86
- ATOM 2 CA CYS 1 1.745 31.604 3.866 1.00 0.00 1CHG 87
- ATOM 3 C CYS 1 2.235 32.701 4.867 1.00 0.00 1CHG 88
- ATOM 4 O CYS 1 2.059 33.902 4.557 1.00 0.00 1CHG 89
- ATOM 5 CB CYS 1 3.000 30.790 3.475 1.00 0.00 1CHG 90
- ATOM 6 SG CYS 1 4.281 31.574 2.277 1.00 0.00 1CHG 91
- ATOM 7 N GLY 2 2.615 32.205 5.965 1.00 0.00 1CHG 92
위의 내용을 살펴보면 컴퓨터에서 나타낼 분자구조를 각각 분자대로 표시하고 있다. 먼저 단백질에 대한 포괄적인 정보들(누가 만들었고 소스는 뭔지와 레퍼런스, 해상도)과 sequence, α-helix, β-pleated sheet에 대한 정보, 마지막으로 각 원자들의 3차원위치에 대한 정보들로 이루워져 있음을 알 수 있다.
위 파일을 메모장이 아닌 3차구조 viewer program (Chime, RasMol등)을 사용하면 3차구조를 바로 볼 수 있다. 그러면 프로그램이 각 원자의 좌표를 읽어들이고 그것을 바탕으로 분자구조를 디스플레이상에 된다. 따라서 분자구조 비주얼 프로그램은 단순히 아미노산서열을 입력해서 자신이 최적 구조를 만들어 내는 것이 아니라 위 처럼 이미 구조계산이 끝난 파일들을 읽어들일 뿐이다.