Tietovarastoarkkitehtuuri on muotoilu, joka kiteyttää yritysympäristön tietovaraston kaikki puolet. Tietovarastointi on keskitetyn verkkotunnuksen luominen monimutkaisten, hajautettujen yritystietojen tallentamiseksi loogiseen yksikköön, joka mahdollistaa tiedon louhinnan, liiketoimintatiedon ja yleisen pääsyn kaikkiin asiaankuuluviin tietoihin organisaatiossa. Tietovarastoarkkitehtuuri sisältää kaikki raportointivaatimukset, tiedonhallinnan, suojausvaatimukset, kaistanleveysvaatimukset ja tallennusvaatimukset.
Tietovarastoarkkitehtuuria luotaessa on tärkeää jakaa arkkitehtuuri tiettyihin alueisiin, jotka yhdistetään kokonaisvaltaiseen lopulliseen suunnitteluun. Tätä mallia on pidettävä yritystietoarkkitehtuurin sinisenä painoksena. Tietovarastoarkkitehtuuria harkittaessa olisi kehitettävä erityisesti useita ensisijaisia alueita. Näitä alueita ovat lähdejärjestelmän käyttö, pysähdysalueprosessi, tietojen rikastamisprosessi, tietoarkkitehtuuri, liiketoimintatiedon käsittely ja tallennusvaatimukset.
Tietovarastointi edellyttää lähdetietojen siirtämistä tapahtuma- tai tietuetietokannasta tietovarastoon. Tämä prosessi on yksinkertaistettu termiksi Extract Transform and Load (Extract Transform and Load, ETL). Selvyyden vuoksi on parempi suunnitella nämä arkkitehtoniset alueet yksityiskohtaisesti, mikä kuvaa, miten ETL -prosessi saavutetaan. Vaikka tietyt tiedot vaaditaan lähdejärjestelmistä, kaikki tiedot eivät ole toivottavia, koska ne ylikuormitaisivat yrityksen varaston. Ensisijaiset huolenaiheet lähdejärjestelmäkerrosta käsiteltäessä ovat tiedonsaantimenetelmät, lähdejärjestelmästä vaadittavat tiedot ja päivitysvaatimukset.
Seuraava harkittava tietovarastoarkkitehtuurikerros on pysähdysalueprosessi. Koska suurin osa lähdejärjestelmien tiedoista edellyttää validointia ja tietojen puhdistamista, on tärkeää luoda laskeutumisalue lähdetiedoille ennen niiden lataamista tietovaraston liiketoimintasääntöihin. Pysähdysalue ylläpitää raakadatasyötteitä lähdejärjestelmistä, jotka on tyypillisesti aikaleimattu tietojen tuoreuden varmistamiseksi.
Tietojen rikastamis- tai liiketoimintasääntöjen prosessi on se, jossa tiedot puhdistetaan tietovaraston halutun tuloksen saavuttamiseksi. Hyvä esimerkki tästä puhdistusmenetelmästä on osoitteenpuhdistusvälineiden käyttö; jos lähdejärjestelmässä on vääriä tietoja, tietojen rikastamisprosessi suorittaa raakatietojoukon osoitteen liiketoimintasääntöjärjestelmään, joka korjaa virheelliset osoitteet. Tämä on myös aika, jolloin virheelliset tiedot poistetaan tai niitä muutetaan tietovaraston täydellisyyden varmistamiseksi.
Seuraava tarkasteltava kerros on tietoarkkitehtuurikerros. Tämä alue on paikka, jossa yrityksen tietovaraston todellinen rakenne tai malli on valmis. Tietovarastointi ei ole yhdistelmä kaikista yrityksen tietojoukoista, vaan se on äskettäin määritelty tietokanta, joka on rakennettu mahdollistamaan yleiskatsaus kaikista yrityksen liiketoimintayksiköistä.
Tämä edellyttää, että tietoarkkitehtuuri vastaa kysymyksiin, joita liiketoiminta esittää liiketoimintatiedon ja tiedon louhinnan alalla. Luomalla tietoarkkitehtuurin tällä tavalla raakatietojoukot muunnetaan tositaulukoiksi, joiden avulla käyttäjät voivat suorittaa ad-hoc-raportoinnin koko yrityskuvasta tietyn tietokannan sijasta. Tämä on myös alue, joka ylläpitää metatietoja raakajärjestelmän tiedoista, jotka voivat sisältää lähdejärjestelmän nimen tai ensisijaiset avaimet.
Seuraavaksi harkittava alue on liiketoimintatiedon ja raportoinnin vaatimukset. Tätä kerrosta voidaan ajatella tietovaraston käyttäjäkohtaisena vaatimuksena. Yleensä tämä alue sisältää valmiita raportteja, ad hoc -raportointitoiminnon ja yrityksen kojelaudat tai hälytykset. Liiketoimintatiedon kerrokset saavat yleensä eniten huomiota, koska se on ainoa ulospäin suuntautuva osa tietovarastossa.
Viimeinen tarkasteltava kerros on yleiset tietojen tallennusvaatimukset ja ylläpito. Kun tietovarasto kasvaa ja laajenee edelleen, käyttäjäkuntatietojen tallennusta on hallittava ja ylläpidettävä tarkasti. Lisäksi tietovarastoarkkitehtuuria luotaessa suunnittelun tulisi tehdä realistisia arvioita siitä, mitä vaaditaan tietojen tallennuskapasiteetilta sekä kaistalta, jolla on tiedonsaantikapasiteetti. Nämä vaatimukset ovat kriittisiä, kun tietovarastoa käytetään laajalti koko yrityksessä.