Tarkistussummat ovat kiinteitä tietolohkoja tai peruspisteitä, joita käytetään tietojen eheyden tarkistamiseen ja ylläpitämiseen tietokoneistettua tietoa tallennettaessa ja lähetettäessä. Käyttämällä matemaattisia funktioita tarkistussumma -algoritmi laskee tietyn tietolohkon bittien määrän ja luo luvun, joka edustaa tarkkaa dataa. Kun tiedot monistetaan millä tahansa tavalla, kaksoiskappale tarkistetaan sitten alkuperäisen numeron perusteella lasketun arvon avulla. Jos luvut täsmäävät, tietojen katsotaan olevan täydellisiä ja tarkkoja.
Useimmat voimassa olevat tiedostonsiirtoprotokollat (FTP) vaativat jonkinlaista tietojen tarkistusta, ja monet toiminnot pystyvät paitsi havaitsemaan myös korjaamaan pienet ongelmat tietojen eheydessä. Jotkin tarkistussummat – tunnetaan myös nimellä hash summat – sisältävät md5- ja sykliset redundanssitarkastukset (CRC). CRC: t ovat eräänlainen tarkistussumma, joka tunnetaan polynomikoodin tarkistussummana ja joka pystyy tunnistamaan alkuperäisen tietomuodon vahingossa tapahtuneet muutokset.
Vaikka tarkistussummat ovat hyödyllisiä havaittaessa virheitä tiedostoista, jotka on ladattu verkosta tai vertaisverkkojen kautta (P2P), niitä käytetään myös kaikissa toiminnoissa, joissa tiedot voivat vioittua siirrettäessä verkon tai tallennusvälineen kautta. Datavirheet johtuvat usein puuttuvista, päällekkäisistä tai vääristä biteistä. Koska tarkistussumman arvo lasketaan datalohkon jokaisen bitin perusteella, jopa yksi puuttuva bitti voi aiheuttaa tarkistussumavirheen.
Useimmat tiedostot koodittavat tarkistussummat suoraan tietoihinsa, yleensä tiedoston loppuun. Kun tiedosto siirretään toiseen järjestelmään tai laitteeseen, vastaanotin lukee tarkistussumman ja tarkistaa algoritminsa avulla, että koko tiedosto on vastaanotettu virheettömästi. Tiedostot, joissa on puuttuvia, vioittuneita tai toistuvia bittejä, eivät ehkä toimi oikein tai ollenkaan. Muut voivat näyttää toimivan oikein huolimatta tarkistussumman epäonnistumisesta. Epätäydelliset tai vioittuneet tiedot voivat heikentyä ajan myötä, kunnes ne muuttuvat käyttökelvottomiksi tai aiheuttavat virheitä.
Perustarkistussummat ovat luonteensa vuoksi yleensä hyödyllisiä vain pienten tietolohkojen tarkistamisessa ja korjaamisessa. Tietojen määrän kasvaessa kasvaa myös virheen todennäköisyys, jota tarkistussumma ei pysty havaitsemaan tai korjaamaan. Tämä voi saada vioittuneet tiedot toistuvasti ohittamaan tarkistussumman, tuottamaan lisää virheitä ja jopa vioittamaan tarkistussumman peruspistettä.
Syklisten redundanssitarkistusten algoritmien monimutkaisuuden vuoksi niiden virhetaso on paljon pienempi kuin tavallisella tarkistussummalla, ja niitä voidaan soveltaa suurempiin datalohkoihin. Vaikka CRC -tiedostot eivät ole suojattuja, ne parantavat edelleen luotettavuutta tietojen eheyden tarkistamisessa ja säilyttämisessä. Jotkin ohjelmistot tarjoavat myös tarkistussummaominaisuuden ja virheiden korjauksen mukautettujen toimintojen perusteella.