KPGP data analysis on Galaxy

관련자료

SNP calling 직접해보기

raw 데이터를 모두 다운로드 받는데만 7T의 공간이 필요하다. 몇명의 bem 파일만 받아 이를 가지고 SNP 찾기. 전체 과정은

  1. bem 데이터를 Shared libraries에 등록
  2. history를 만들고 bem 파일 로딩
  3. flatstat 으로 bem 파일 통계 보기
  4. pileup 하기

pileup을 위해서는 레퍼런스 파일이 있어야 한다. hg19.fa, hg19.fa.fia 파일이 필요함

$ wget http://hgdownload.cse.ucsc.edu/goldenPath/hg19/bigZips/hg19.2bit 
$ # install blat http://hgdownload.cse.ucsc.edu/admin/exe/linux.x86_64/blat/
$ twoBitToFa hg19.2bit hg19.fa
$ samtools faidx hg19.fa

SAMtools 0.1.18은 pileup 대신 mpileup 명령을 사용하며, 조금 다르다. 아직 galaxy tool이 만들어지지 않은 상태. samtools를 0.1.16으로 다운그레이드

KpgpOnGalaxy (last edited 2011-12-26 10:32:58 by 211)

web biohackers.net