Emäsparit ovat nukleotidipareja, jotka on liitetty DNA: sta ja RNA: sta löytyneeseen vetysidokseen. Tämä geneettinen materiaali on tyypillisesti kaksijuosteista, ja sen rakenne muistuttaa tikkaita, ja kukin perusparisarja muodostaa yhden tikkaat. Peruspareilla on useita mielenkiintoisia ominaisuuksia, jotka tekevät niistä kiinnostavia aiheita, ja ymmärrys siitä, miten perusparit toimivat, on tärkeää monille geenitieteilijöille.
DNA: ta muodostavat nukleotidit ovat adeniini (A), tymiini (T), sytosiini (C) ja guaniini (G). RNA: ssa tymiini korvataan urasiililla (U). Yhdessä nämä pienet kemialliset yhdisteet muodostavat organismin geneettisen koodin, ja niiden järjestely koodaa useiden proteiinien tuotantoa. Adeniini voi sitoutua vain tymiinin kanssa ja kystosiini vain guaniinin kanssa. Tämä tarkoittaa esimerkiksi sitä, että kun DNA -juosetta tutkitaan, jos askeleen toisessa päässä on A, T: n on oltava toisessa.
Adeniini ja guaniini ovat molemmat puriineina tunnettuja molekyylejä, kun taas tymiini ja sytosiini ovat pyrimidiinejä. Puriinit ovat suurempia, ja niiden rakenne estää kahta niistä asentamasta yhdelle tikkaat, kun taas pyrimidiinit ovat liian pieniä. Tämä tarkoittaa sitä, että adeniinista ei voi tulla emäsparia guaniinin kanssa, eikä tymiini voi olla emäsparissa sytosiinin kanssa.
Voidaan kohtuudella kysyä, miksi puriiniadeniini ei voinut sitoutua pyrimidiinisytosiiniin ja miksi tymiini ei voi sitoutua guaniiniin. Vastaus liittyy näiden yhdisteiden molekyylirakenteeseen; adeniini ei voi muodostaa vetysidosta sytosiinin kanssa, aivan kuten tymiini ei voi muodostaa vetysidosta guaniinin kanssa. Nämä ominaisuudet sanelevat perusparien perustavanlaatuisen järjestelyn, jossa yhdiste askelman toisessa päässä sanelee, mikä yhdiste on toisella puolella.
Yhden geenin muodostamiseen tarvitaan lukuisia emäsparien sarjoja, ja mikä tahansa DNA-juoste voi sisältää lukuisia geenejä niiden osien lisäksi, jotka tunnetaan nimellä “ei-koodaava DNA”, DNA, jolla ei näytä olevan mitään tehtävää. Ihmisen genomi sisältää arviolta kolme miljardia emäsparia, mikä selittää, miksi ihmisen genomin sekvensointi kesti niin kauan, ja emäsparien järjestelyn ymmärtäminen ei auta ihmisiä ymmärtämään, missä tietyt geenit sijaitsevat ja mitä nämä geenit tekevät. Tavallaan perusparia voitaisiin pitää aakkosena, jota käytetään geneettisen koodin kirjan kirjoittamiseen.