BAC clone sequencing. 컨소시엄측(다국적팀)에서 HumanGenomeProject에 사용한 LargeScaleSequencing방법.
BAC클론을 먼저 만들고, 해당 클론을 더욱 쪼개서, 시퀀싱한 방법으로, 직접 쪼갠 WholeGenomeShotGun과 차이가 있다.
BAC은 평균 15만 염기쌍을 포함하고 있으므로, 이론적으로는 2만개 정도면 HumanGenome전체를 포함할 수 있겠지만, 실제로는 3만개의 BAC을 겹치도록 사용했다. 자동염기서열 분석 장치가 한번에 읽을 수 있는 염기 수가 약 5백개 정도이므로, BAC 클론을 무작위로 잘라, 염기쌍이 1천개보다 큰 조각의 염기서열을 앞뒤로 약 500개씩 읽어 FragmentAssembly를 수행한다.
FragmentAssembly는 서열 정보를 비교하면서 겹치는 부위를 찾아, 이들을 연결해서 하나의긴 서열을 재구성하는 작업이다. 다국적팀은 모두 5800만번의 염기 서열 분석을 거쳐 약 230억 염기쌍의 서열을 읽었는데, 이는 인간 유전체의 8배에 해당하는 양(8x)으로, 짜깁기 작업을 위해 중복해서 읽었기 때문이다. 2001년 2월 네이처에 발표한 99% 초안은 40만개의 단편으로 이루어져 있고, 단편들 사이의 틈새를 없애고 24개의 염색체 (22쌍과, X, Y 염색체) 작업이 앞으로 남은 1%의 과제이다.