[HumanMolecularGenetics] CHAPTER 11 Genetic mapping of mendelian characters
11.1 Recombinants and nonrecombinants
- - in human, genetic mapping의 목적은 two loci가 meiotic recombination에 의해 얼마나 자주 분리되는 가를 알아보는것 - father (-A1--B1-,homozygote) --- mother (-A2--B2-,homozygote)
- l
- -A1--B1-
-A2--B2-(heterozygote) : nonrecombinant -A1--B2-
-A2--B1-(heterozygote) : recombinant
recombinant fraction : A와 B loci 사이에서 children 중 recombinant의 비율 === 11.1.1 The recombination fraction is a measure of genetic distance ===
- - two loci가 다른 chromosome에 있으면, 독립적으로 segregate
- -A2--B2- -A1--B1- 에서 spermatogenesis가 일어나는 동안, A1이 B2 allele를 받을 chance : 50%(recombinant)
- A1이 B1 allele를 받을 chance : 50%(nonrecombinant)
-> recombination fraction : 0.5
- -A2--B2- -A1--B1- 에서 spermatogenesis가 일어나는 동안, A1이 B2 allele를 받을 chance : 50%(recombinant)
- two loci가 syntenic하면(같은 chromosome내에 있다면), 같이 segregate (meotic cross-over를 무시) -> no recombination - recombination은 가깝게 있는 locus를 separate 못하는데(드물게 separate 될때도 있다.)
- 가까이 있는 locus는 한 set로 block처럼 transmit 된다. 이러한 block allele들을 haplotype이라 한다.
- two loci가 1% recombination을 가질때 1cM 으로 정의 === 11.1.2 Recombination fractions do not exceed 0.5 however great the physical distance === - Figure 11.2 - two loci가 멀리 떨어져 있으면, double recombination이 발생, two, three, four-strand가 관여 - 전체적인 recombination의 비율은 50%이다. so, 아무리 멀리 떨어져 있어 cross-over가 잘된다 해도 50%를 넘지 않는다. === 11.1.3 Mapping functions define the relationship between recombination fraction and genetic distance === - --A-B-C-D-E-.........-M-...: A와 M 의 recombination fraction은 60%가 아니다.
- 5 5 5 5.......
- recombination fraction과 genetic map distance 사이의 관계는 mapping function으로 describe
cross-over가 randomly 발생하고, 다른것에 영향을 주지 않는다면, Haldane's function을 이용
- w = -1/2 ln(1-2θ) or θ = 1/2{1-exp(-2w)}
- w=map distance, θ = recombination fraction
-> but, cross-over는 random하게 일어나지 않는다.
- w = -1/2 ln(1-2θ) or θ = 1/2{1-exp(-2w)}
interference의 정도차가 있기 때문에 Kosambi's function을 사용
- w = 1/4 ln{(1+2θ)/(1-2θ)} or θ = 1/2{exp(4w)-1}/{exp(4w)+1]}
- (DB에 따르면 total length = 2851cM)
- female의 total map length는 4296cM이다.(X를 제외) autosomal genome이 3000Mb이므로,
- male의 평균 cM은 3000Mb /2851cM = 1.05Mb/cM female의 평균 cM은 3000Mb / 4296cM = 0.7Mb/cM
so, average (1.05 + 0.7)/2 = 0.88Mb --> 대략 1cM = 1Mb로 사용
- male의 평균 cM은 3000Mb /2851cM = 1.05Mb/cM female의 평균 cM은 3000Mb / 4296cM = 0.7Mb/cM
- male : telomere 쪽에서 보다 높은 recombination female : centromere 쪽에서 보다 높은 recombination
-> male은 이 region에서 2.6Mb 안에서 cross-over가 일어나는데, 이 부위는 실질적으로는 50cM에 해당한다. so, 1Mb = 19cM(50% / 2.6 Mb)이 됨
- female은 1Mb = 2.7cM(7% / 2.6Mb)에 해당
11.2 Genetic Markers
- === 11.2.1 Mapping human disease genes requires genetic markers === - disease들 사이에서 recombination fraction의 계산은 mapping에 좋은 방법이지만, human에서 disease-disease mapping은 불가능하다.
- (because double heterozygote 이어야 하는데, 두개의 다른 disease에서 heterozygote는 극히 드물기 때문)
-> 이런 경우에 human 에서는 mapping을 marker에 의존(Mendelian character를 Marker로 사용)
- recombinant fraction이 0.3 이라면 85번의 meiosis가 필요(Box 11.3)
- uninformative인 것은 parent 모두 homozygote or 같이 heterozygote 인데 marker에 대해 uninformative한 경우
- frequency p1,p2,p3...를 갖는 marker allele A1, A2, A3..이 있을때 Heterozygouse를 가진 사람의 비율은 1-(p12 + p22 +p3^2...)이다.
- 보다 유용한 측정으로 A1A2 둘다 heterozygouse인 couple에 대해서도 가능한 PIC(polymorphism information content)를 이용 === 11.2.3 DNA polymorphisms are the basis of all current genetic markers === - 1980년대 초 처음으로 DNA polymorphism이 보고 - DNA marker의 장점은 same technique에 의해 typing되어 질수 있다는 것 (FISH or radiation hybrid mapping) - linkage paraoxonase의 protein polymorphism은 찾았어도 chromosome에서의 location은 알지 못한다. - DNA marker의 발달로 인해 본격적인 human gene mapping이 시작
- RFLPs
- limited informativeness라는 한계가 있고, only two alleles만 가능(site의 유무)
- Minisatellites
- 전체 genome에 균등히 퍼져 있지 않다.
- Microsatellites
- PCR을 이용하여 size allele 구별
- SNPs
- solid-array 이용
- (because double heterozygote 이어야 하는데, 두개의 다른 disease에서 heterozygote는 극히 드물기 때문)
11.3 Two-point mapping
- === 11.3.1 Scoring recombinations in human pedigrees is not always simple === - family를 수집한 후
How do we know when we have found linkage?
- recombinant fraction ?
- what statistical test ?
- not-link 이면 = 0.5
- 이들 likelihood의 ratio는 linkage의 odd로 주어지고, 이 odd logarithm이 lod score이다. - lod score는 linkage pedigree를 평가하는데 가장 좋은 통계법 - human linkage analysis는 computer program에 의존하는데, pedigree data and gene frequency를 알 수 있다. === 11.3.3 Lod scores of +3 and -2 are the criteria for linkage and exclusion (for a single test) === - Box 11.3 - positive lod = linkage가 있는것, negative lod = linkage가 없는것이다. - 모든 lod score는 recombination fraction(θ) = 0.5에서 '0'이다. - θ = recombination fraction, likelihood이기도 함
- 1-θ = non-recombinant의 likelihood
- z=0.3 은 5% error를 갖는 linkage에 대한 threshold이다. (p<0.05를 중요한 threshold로써 사용하곤 함) - z=0.4은 1000:1 odd에 해당, 이 threshold는 linked이고, random하게 선택한 two loci가 유전되어질 것 같지 않을 때 선택 - 어떤 것이 유전적으로 일어나기 힘든일이라면, 그것이 true임을 보이기 위한 strong evidence가 필요
- 이러한것은 Bayesian calculation에서 qualify할 수 있다.(1000:1 odd는 p=0.05에 해당)
- exclusion mapping : negative lod score( Z <-2 )이면, 그 부분에 disease gene이 없다는 것임 === 11.3.4 For whole genome searches a genome-wide threshold of significance must be used === - disease에 대한 연구에서 positive lod를 얻을때 까지 family의 marker를 typing한다. - genome 어느곳에서나 p=0.05를 갖는 false positive를 얻을 수도 있다. - 50개의 marker를 사용했을때가 1개를 사용한 것 보다 false positive result를 얻기가 쉽다.
-> stringent 과정은 significance를 test하기 전에 p value에 50을 곱해준다.
- (n)개의 marker를 사용했을 때 threshold lod score는 3 + log(n)이된다.
- ex) 10개를 marker로 쓰면, 3 + log(10) = 4, 100이면, 3 + log(100) = 5
- 일반적으로 Mendelian character는 3.3으로 사용, 실제로 lod score는 marker의 수에 상관없이 5이하로 임시적으로 고려하고 있다.
11.4 Multipoint mapping is more efficient than two-point mapping
- === 11.4.1 Multipoint linkage can locate a disease locus on a framework of markers === - linkage analysis는 two loci 이상이 동시에 분석될때 보다 효율적, multilocus analysis는 linked loci들의 set에서 염색체상의 순서를 정할때 유용
-> 유전학자들은 three-point cross를 이용
--> marker-marker mapping이 이문제를 해결
n marker의 경우 n!/2 경우의 수가 있다. 그리구 chromosome당 수백개의 marker를 가진다.
11.5 Standard lod score analysis is not without problems
- standard lod score analysis는 disease gene이 위치한 20Mb segment내에서는 유용하지만, 어려운점이 있다.
- === 11.5.1 Errors in genotyping and misdiagnoses can generate spurious recombinants === - common error(misread gels. switched samples nonpaternity)는 parent와 모순된 genoype을 가진 child의 결과가 나올수 있다.
-> misdiagnosis -> false recombinant의 add에 의해 genetic map의 길이를 늘리게 된다.
- ( false recombinant는 close double recombianant로 나타나기 때문)
-> can handle large pedgree, but 가능한 haplotype의 수가 증가하면 computing time exponentially increase -> multipoint data를 analyze하는데 MLINK는 역부족
-> genotype의 수에 상관없이 처리, but computing time은 pedigree size에 따라 exponentially increase -> 적절한 size의 pedigree를 가지고, whole-genome을 분석할때는 good
- children은 수가 적은 반면, doubly heterozygous man의 sperm을 분리하여 PCR 수행
- Autozygosity : 최근 공통조상으로부터 유전된 동일한 marker에 대해 homozygosity 의미로 사용 - 동족 family에서 드문 recessive disease를 가진 사람은 disease locus에 link 된 marker가 autozygous가 된다. - 만약 한 child에서 특정 marker allele가 homozygous이면, 이것은 autozygosity 때문이거나, 같은 allele의 2nd copy가 독립적으로 family로 들어갔을 때 발생 - 매우 작은 inbred family들도 중요한 lod score를 만들어 낼 수 있다.
- autozygosity mapping은 둘 또는 그 이상의 친척관계에서 영향을 받은 사람들이 많은 family를 찾는다면 linkage analysis에 좋은 tool이 된다.
- (유전형태, gene frequency, genotype의 penetrance..)
- for mendelian, penetrance가 main problem area 이다.
- (Complex disease는 더 다루기 힘듬 - chapter 12)