HapMap. The International [HaplotypeMap]ping Project
http://www.hapmap.org/index.html.en
[Nature] 426:789-796,2003 원문
목적 : HumanGenome 에서 [DNA]서열 변이의 common pattern을 결정하고, 여기서 만들어진 정보를 public domain에서 자유롭게 사용할 수 있게 함.
Human DNA sequence variation
인간 유전체의 2개 [Allele]사이에는 약 0.1%의 염기 차이가 있다(대략 1000 bp 당 하나). 이것은 전세계 인구에서는, 약 1000만개의 위치(평균 300 bp 당 하나)는 두개 대립 유전자 사이의 차이가 1% 이상의 빈도(돌연변이 빈도 1% 이상)로 관찰되는 것이며, 이들 1000만개의 [SNP]의 90%는 common SNPs로 구성되어 있고, 나머지 10%는 광대한 돌연변이들의 배열이다.
한 영역내의 각각의 common [Haplotype]를 식별하기위해서는 아주 적은 수의 TagSNPs이 요구된다. 1000만개 common SNPs 중 약 20만 - 100만개의 TagSNPs가 존재한다. 이것을 [LD]를 이용하여 최소한의 정보 손실만을 허용하면서 [Genotyping]하는 양을 줄일 수 있다.
Common SNPs에는 historical Recombination pattern이 나타나며, 몇몇 Recombination은 HotSpot들에서 반복적으로 나타나며, 이 사실은 ancestral [Chromosome] 영역에 mosaics pattern으로 나타만으로써 증명된다. 이러한 결과는 대상 집단내에서 그리고 대상 집단 사이에서 명백하게 관련이 없는 [Chromosome] 사이에 [Haplotype]과 [LD] pattern이 공유되고 있음을 설명해주는 증거이다. .
이 관찰 결과가 HapMap의 개념적, 실험적 근거 이며, 이렇게 만들어진 HapMap은 [SNP]간의 Association을 포함한 돌연변이의 일반적 형태(general pattern)를 설명해 줄 수 있다.
The International HapMap Consortorium
Ethical issue, scientific plan, 연구 구룹 선정을 목적으로 2001년 7월에 Washington DC에서 처음 모임이 있었다. 2002년 8월에 The International HapMap Consortorium이 정식으로 구성되었다.
DNA samples and populations
Pilot study에서 보면 Yoruba, Japanese, Chinease 그리고 Northern and Western Europe의 대상들 사이에서 Haplotye pattern이 상당히 유사함을 알 수 있다.
Choice of SNPs
전체 유전체를 통해 적절한 유전 변이를 설명하기 위해서는 고밀도의 SNPs이 요구된다. 처음 project가 시작될 당시에는 public database dbSNP의 평균 marker density는 대략 매 kilobase에 하나(2.8 milion SNPs) 이었으나, 이것은 너무 저밀도 였다.
Project의 목표는 MinorAllele의 빈도가 최소 5% 이상이고 평균 간격이 5 kilobase 인 60만개 SNPs을 genotype 하는 것이다.
[Genotyping]
Data release
Data analysis
각 maker들 사이의 [LD] 값을 D', I2 등을 이용하여 계산한다. High [LD] 가 나타나거나 [Haplotype]이 유난이 밀집 된 영역을 정의하기 위한 다양한 방법들이 평가 되고 있다. 현존하는 방법들은
를 측정하는 법등 이다. Project의 첫 단계인 [LD] 분석이 완료 된 후에는 [LD]가 약하거나 없는 영역을 찾아내고 향후 [SNP] selection과 genotyping을 위해 순위를 매긴다.
Conclusion
InternationalHapMapProject의 목적은 연구자로 하여금, 질병에 걸리기 쉽게 하거나(disease susceptible) 질병을 억제하는 또는 약물에 반응하게 하는 유전적 요소들을 전 인류 대상 차원에서 발견 할 수 있게 하는 research tool을 개발하는 것이다. HapMap은 CandidateGene, Linkage-based, Genome-wide association study, 실행하기 어려운 transforming strategy 등을 수행하는데 있어 중요한 지름길 역할을 할 것이다.
EncodeProject에 활용된다.