Genomi on kokoelma yhdestä organismista peräisin olevaa geneettistä materiaalia. Koska tämän geneettisen materiaalin järjestys ja rakenne ohjaavat koko biologista elämää, tutkijat ovat erittäin kiinnostuneita selvittämään, mitä he kaikki ovat. Genomitietokanta on ristiviittauksellinen kokoelma tietoa yhdestä tai useammasta organismista, joten yksi tiedemies voi tarkastella kaikkia saatavilla olevia geneettisiä tietoja auttaakseen häntä tutkimuksessa.
Genomit ovat erittäin monimutkaisia ja sisältävät miljardeja emäksiä informaatiosekvenssissä. Tietokoneistetut tietokannat ovat siis ainoa käytännöllinen tapa järjestää tiedot yhteen paikkaan. Yleensä ne ovat saatavilla tieteellisen tutkimuksen online -tietokantoina. Suhteellisen uusi tieteenala, nimeltään bioinformatiikka, on kehittynyt täydentämään tapaa, jolla biologiset tiedot voidaan tulkita tietokonejärjestelmien kautta.
Genomitietokannat sisältävät organismin geenien sekvenssin, jos koko sekvenssi tunnetaan. Muussa tapauksessa se voi sisältää osittaisia sekvenssejä. Esimerkiksi ihmisen, hiiren ja Drosophila -perhonen genomit on sekvensoitu. Kun genomin sekvenssi on tiedossa, geneetikot voivat tunnistaa tietyt geenit genomissa. Jokainen geeni on tietyn solutuotteen ohjelehti.
Jos geenillä on mutaatio, sillä on eri sekvenssi kuin normaalilla, toiminnallisella geenillä. Mutaatiot voivat olla hyödyllisiä ja tuottaa hyödyllisen ominaisuuden mutatoituneessa organismissa. Ne eivät myöskään voi vaikuttaa tuotteeseen tai ne voivat olla haitallisia organismin normaalille toiminnalle. Esimerkiksi monet sairaudet johtuvat tietyn geenin mutaatioista.
Mutaatioita voidaan käyttää myös laskettaessa, kuinka läheinen sukulainen tietty laji on toiselle, koska mutaatioita kertyy enemmän ajan myötä. Yksilöt voivat myös vaihdella genomin sekvenssissä, varsinkin kun suuret osat genomista eivät ole geenejä eivätkä koodaa mitään välttämätöntä solutuotetta. Genomitietokanta sisältää sekvenssin organismista, joka on nimetty standardiksi, mutta mielivaltaisesti valitun standardin ja lajin muiden yksilöiden välillä on monia pieniä eroja.
Monista eroista huolimatta geenit tunnistetaan sekvenssien avulla. Jos geneetikot tietävät, mitä tietty geeni tekee yhdessä organismissa, geeni, jolla on samanlainen sekvenssi toisessa eläimessä, suorittaa todennäköisesti saman tehtävän. Geenitieteilijät voivat käyttää genomitietokantaa joko tunnistamaan tutkittavan geenin tai selvittämään, mitä geeni tekee.
Jokainen genomitietokanta on haettavissa. Yleensä tutkijat voivat hakea tietokannasta useilla eri tavoilla. Yleensä hän voi syöttää sekvensoidun geenin sekvenssin. Sitten tietokanta löytää yhden tai useamman samanlaisen sekvenssin vertailua varten.
Yksinkertaisempi tapa etsiä tietokannasta edellyttää geenin avainsanan, kuten geenin nimen, etsimistä. Viranomaiset, kuten Yhdysvaltain kansallinen biotekniikkatietoviranomainen (NCBI), voivat antaa sekvensseille erilliset viitenumerot, ja geneetikko voi myös etsiä genomitietokannasta käyttämällä yhtä näistä tunnisteista. Hän voi myös kaventaa tuloksia käyttämällä enemmän hakuparametreja. Ristiviittaus on useimpien genomitietokantojen ominaisuus, ja yhden sekvenssin tulos antaa tietokannan käyttäjälle myös hyödyllisiä linkkejä lisää geneettistä tietoa varten. Tietyt sekvenssitiedot sekä monet tietokannat tarjoavat visuaalisen esityksen sekvenssistä ja kyseisen alueen merkittävistä ominaisuuksista.
Eri organismeilla voi olla erityisiä genomitietokantoja, mutta jotkut suuret tietokannat sisältävät useamman kuin yhden lajin. Eri viranomaiset valvovat käytettävissä olevia tietokantoja, joten kaikki tietokannat voivat käyttää eri muotoja ja hakutoimintoja. Esimerkkejä näistä viranomaisista ovat NCBI, Euroopan bioinformatiikan instituutti tai jopa yksittäiset yliopistot.