Suuret tiedot ovat mittauksia datasta, joka on kasvanut niin suureksi, että normaalit tietokannat eivät pysty sisältämään ja käsittelemään valtavaa tietomäärää. Tietoja on kolmea kokoa: pieni, keskikokoinen ja suuri; mikään näistä mittauksista ei ole tiukka; Sen sijaan kukin riippuu enemmän helppokäyttöisyydestä ja siitä, minkä tyyppinen kone voi käsitellä tietoja. Isoihin tietoihin tarvitaan erikoiskoneita, jotka ovat paljon suurempia ja monimutkaisempia kuin tavallisissa tietokannoissa käytetyt. Tämäntyyppisiä tietoja löytyy tyypillisesti julkishallinnosta ja tieteellisistä virastoista, mutta jotkut erittäin suuret verkkosivustot sisältävät myös tämän suuren määrän tietoa.
Tietoja on kolme vakiokokoa, mutta ei tiukkoja. Pienet tiedot mahtuvat yhteen tietokoneeseen tai koneeseen, kuten kannettavaan tietokoneeseen. Keskikokoiset tiedot mahtuvat levyjärjestelmään ja niitä hallitaan parhaiten tietokannan avulla. Tietokannat, olivatpa ne kuinka suuria tahansa, eivät pysty käsittelemään suuria tietoja, ja sen sijaan käytetään paljon erikoisjärjestelmiä. Vaikka suurta dataa ei ole tiukkoja ohjeita, se alkaa tyypillisesti teratavu (TB) -tasolta ja nousee petatavun (PB) tasolle.
Suurten tietojen käsittely tietokannassa, joka ei ole erikoistunut tähän tietomäärään, aiheuttaa useita merkittäviä ongelmia. Tietokanta ei pysty käsittelemään tietomäärää, joten osa tiedoista on poistettava. Tämä on kuin yrittäisi sovittaa 100 gigatavua tietokoneeseen, jossa on vain 50 Gt kiintolevytilaa; sitä ei voida tehdä. Jäljelle jäävät tiedot ovat raskaita hallita ja hallita, koska minkä tahansa toiminnon suorittaminen kestää kauan ja tietokanta on suljettava uusilta lähetyksiltä.
Vaikka on mahdollista jatkaa koneiden ostamista ja uusien tietojen lisäämistä tietokantoihin, tämä aiheuttaa vaikean ongelman. Tämä johtuu siitä, että tietokantaohjelmisto on tehty toimimaan vain keskitason tietojen kanssa. Suuremmat tietojoukot johtavat virheisiin ja hallinnollisiin ongelmiin, koska ohjelmisto ei yksinkertaisesti voi liikkua tai työskennellä suurten tietojen kanssa ilman ongelmia.
Useimmat organisaatiot tai verkkosivustot eivät kohtaa suuria tietoja. Puolustus- ja sotilasvirastot käyttävät tätä tietomäärää mallien luomiseen ja testitulosten tallentamiseen, ja monet suuret tieteelliset virastot tarvitsevat näitä erikoiskoneita vastaavista syistä. Jotkut erittäin suuret verkkosivustot tarvitsevat suuria datakoneita, mutta sivustot eivät ole niin yleisiä kuin virastot näillä markkinoilla. Näiden organisaatioiden on säilytettävä kaikki tietonsa, koska se auttaa paremmin analysoimaan tulevia tietoja ja tekemään ennusteita.