Genomikokoonpano viittaa prosessiin, jossa otetaan monia pieniä palasia geneettistä sekvenssiä ja yhdistetään ne yhteen yhtenäiseksi kokonaisuudeksi, joka edustaa organismin koko genomia. Tämä on bioinformatiikan tärkein painopiste, ja tätä tarkoitusta varten on olemassa erilaisia genomiprojekteja. Genomikokoonpanoa on käytetty monien lajien, mukaan lukien ihmisten, kasvien, eläinten ja bakteerien, genomien analysoinnin aloittamiseen.
Organismin geenien analysointi on pitkä prosessi, ja genomikokoonpano on yksi ensimmäisistä vaiheista. Monet muut analyysimenetelmät perustuvat onnistuneeseen kokoonpanoon, eikä geenien tunnistaminen voi edetä ilman sitä. Jo ennen geenien löytämistä onnistunut genomikokoonpano voi silti tuottaa paljon hyödyllistä tietoa myöhempää analyysiä varten, mukaan lukien genomin koko, sen rakenne ja sen yleinen koostumus.
Genomin kokoamisprosessi on kuin palapelin asettaminen yhteen ilman kuvaa tai hyödyllisiä muotoja oppaana. Kun kohtaamme ensimmäiset genomikappaleet, joita kutsutaan raakalukemiksi, on harvoin viitteitä siitä, mihin tietty pala menee, tai jopa miten se on suunnattu. Jokainen pala koodataan samalla tavalla neljän DNA -emäksen kanssa, lyhenne A, C, G ja T. Genomi voidaan tiivistää yhdeksi suureksi kromosomiksi tai jakaa moniin. Ei myöskään ole takeita siitä, että jotkut raakalukemat eivät ole saman genomialueen kaksoiskappaleita, mikä tarkoittaisi sitä, että ainutlaatuista tietoa on vähemmän kuin se näyttää ensi silmäyksellä.
Yleinen tieto genomin rakenteesta on korvaamatonta, kun aloitetaan kokoonpanoprosessi. Vaikka lajien väliset genomit ovat selvästi erilaisia, on tiettyjä sääntöjä, joita tietyt genomityypit noudattavat, ja niitä voidaan soveltaa, kun yhdistetään toinen saman tyyppinen genomi. Jos esimerkiksi tietyllä organismityypillä on aina tietty kuvio lähistöllä, josta geenejä löytyy, voitaisiin kohtuudella olettaa, kun kootaan toinen samanlainen organismi, että tällaisen kuvion löytäminen merkitsisi lähellä olevaa geeniä. Suuremmassa mittakaavassa monilla bakteerien genomeilla on yksi pyöreä kromosomi, joten olisi järkevää olettaa, että kaikki uuden bakteerin raakalukemat sopisivat jotenkin yhteen kromosomiin. Yleisen geneettisen tiedon soveltaminen tällä tavalla voi antaa tutkijalle mahdollisuuden ymmärtää mahdollisesti satoja tuhansia tietoja.
Genomikokoonpanossa voidaan käyttää monia muita menetelmiä, mukaan lukien laskennalliset ennusteet ja manuaaliset vertailut. Menetelmästä riippumatta genomin kokoaminen on suuri työ, joka on usein aikaa vievää ja vaikeaa. Koska se on perusta monille tuleville organismin geneettisille analyyseille, ei ole paljon tilaa virheille.