최근의 생물정보학방법들에 의해서 많은 데이터들이 전세계 인터넷을 통해서 제공되고 있다. 그러나, 이들 데이터들은 모두, 개개의 성격에 맞도록 특성화되어 있다.
GenBank의 서열정보를 가지고, 바로 병세정보 및 ProteinStructure정보들을 바로 얻어낼 수 없는 상황이다. 생명현상은 이들 개개의 모든 정보들의 종합임을 되새겨보면, 이들 데이터들을 효과적으로 서로 통합시키고, 연결시키는 과정이 얼마자 중요한가를 알 수 있을 것이다. 따라서 이 분야, BioDatabaseIntegration 역시 생물정보학의 큰 도전으로 여겨지고 있다.
Important BiologicalDatabase for Bioinformatics
- [Genome]
[Ensembl], [AceDb]
[GDB], NcbiGenome, [Ensembl], FlyBase, [MGD], [SGD], [MITOMAP]
- [GOLD]
- [PEDANT]
기본정보 : [Entrez], GenBank, [EMBL], [DDBJ], NcbiGenome
[EST] : [dbEST], UniGene, TigrGeneIndices, StackDb, [H-InvDB]
[Gene] : GeneCards
- [Promoter] : [EPD]
- [STS] : [dbSTS], [RHdb]
Vector : UniVec
- Polymorphic region : [dbSNP]
- [Protein]
기본정보 : SwissProt, InterPro, GenPept, TrEmbl, TrEst, TrGen, [PIR], UniProt
ProteinFamily : [PROSITE], [Blocks], [Pfam], ProDom, [PRINTS], [COG], [CDD]
ProteinStructure : [PDB], [SCOP], [CATH], [FSSP]
ProteinProteinInteraction : [DIP], [MIPS], [http://portal.curagen.com/pathcalling_portal/index.htm PathCalling], ProNet
- [KEGG]
MolecularInteraction : [BIND]
- [STKE]
- [OMIM]
- [HemoPDB]
- Biochemical
- [REBASE], [LIGAND], [BRENDA]
- 실험정보
MicroArray : ArrayExpress, StanfordMicroArrayDatabase, [GEO]
[QTL] : PigQtlDb
- 문헌정보
Useful Information about Biological Database
[http://www.bioinformatics.pe.kr/link/database.html Databases] : In BioinformaticsInformation
[http://bioinfo.sarang.net/data/varexp/virexp.html 생물DB를 이용하는 가상실험]
Scripts for acessing Biological Database
[PsiBlastQuery.rb] - psi-blast를 biopython을 이용하지 않고 IE Automation을 이용한 무식한 방법 ([Ruby]이용)
Tools for bioinformatics
[http://www.ebi.ac.uk/thornton-srv/databases/cgi-bin/valdar/scorecons_server.pl The Scorecons Server] : MSA sequence 정보를 이용해서 각 AminoAcid의 conservation score를 구해준다.
이곳 BioinfoWiki에서는 InterWikiForBioinfo를 통해서, 각각 유용한 [Database]에 바로 접근할 수 있다.