Konsensussekvenssi on joukko proteiineja tai nukleotideja deoksiribonukleiinihapossa (DNA), joka esiintyy säännöllisesti. DNA koostuu nukleotideista ja jokainen nukleotidi koostuu fosfaatista, sokerista ja typpiemäksestä. Typpiemäkset voivat olla adeniini (A), tymiini (T), guaniini (G) ja sytosiini (C). Näiden kemiallisten emästen järjestys määrittää organismin geneettisen koodin. Geneettinen koodi on kuin käsky, jonka perusteella organismi rakennetaan ja sitä ylläpidetään. Molekyylibiologit käyttävät usein tilastoja ennustaakseen sekvenssien sijainnin tai ymmärtääkseen, missä tietyt molekyylit yleensä sitoutuvat. Kaavoja voidaan käyttää edustamaan paikkoja, joissa aminohapposekvenssit pysyvät samoina, ja paikkoja, joissa ne vaihtelevat. Esimerkiksi konsensuspromoottorisekvenssin tapauksessa tietyntyyppinen entsyymi voi sitoutua samoin sekvensoitujen proteiinien kohtiin.
Geenitieteilijät, kuten monien tieteenalojen tutkijat, käyttävät usein korvauksia monimutkaisten järjestelmien yksinkertaistamiseen. Kehossa on niin paljon aminohappoemäksiä ja -geenejä, että tutkijat eivät voi laskea niitä, ellei siihen ole olemassa yleistä järjestelmää. Konsensusjärjestys voi esiintyä monissa paikoissa DNA: ssa sekä erilaisissa elävissä olennoissa. Yhtäläisyydet ja erot, joita esiintyy, voidaan ilmaista kaavalla.
Tilastollisesti tutkijat voivat luokitella geneettisiä sekvenssejä etsiäkseen malleja. Toistuvia kuvioita, joita kutsutaan sekvenssimotiiveiksi, käytetään yleensä edustamaan geneettisiä alueita, jotka ohjaavat tiettyjä biologisia prosesseja. Konsensussekvenssit voivat myös tarjota tietoa siitä, miten proteiinit syntetisoidaan tai miten molekyylejä ohjataan solussa.
Konsensussekvenssin merkinnöissä joidenkin nukleotidien sijainti voi osoittaa, että ne ovat aina edustetussa paikassa. Voidaan myös osoittaa, että yksi tai toinen nukleotidi voi olla siellä. Tässä tapauksessa sitä, kuinka usein aminohappo esiintyy toisen sijasta, ei yleensä ilmoiteta. Graafista mallia käytetään joskus osoittamaan tämä taajuus lisäämällä tai pienentämällä symbolien kokoa. Jotkin ohjelmistot voivat luoda sekvenssilogoja automaattisesti.
Usein konsensussekvenssi vastaa tunnistettua proteiinia sitovaa kohtaa. Genomin sekvenssien kuvaamiseksi tarkasti käytetään usein matemaattisia kaavoja. Näitä ovat tilastolliset kaavat, kuten logaritmit ja numeeriset arvot, jotka voivat olla positiivisia tai negatiivisia, geneettisen tiedon sijainnin kuvaamiseksi. Genomin prosessit normaaleille biologisille toiminnoille sekä sairauksiin liittyvät prosessit voidaan analysoida tällä tavalla.
Konsensussekvenssin matemaattiset esitykset tarjoavat yleensä DNA- ja aminohappomallien mallin. Tarkkaa kuvaa ei yleensä anneta. Sekvenssit voivat kuitenkin auttaa tutkijoita yhdistämään genomin eri osien toiminnalliset näkökohdat organismien evoluutiomalleihin.