Mikä on kapasiteetin optimointi?

Kapasiteetin optimointi koostuu erilaisista ja usein toisiaan täydentävistä menetelmistä sekä tietojen tallentamiseksi että tallennustarpeiden vähentämiseksi varmuuskopioita tehtäessä. Usein yritykset ja yksittäiset yritykset tekevät useita varmuuskopioita työstään, ja tarve tallentaa, indeksoida ja noutaa tietoja edellyttää optimointia, jotta voidaan vähentää laitteiston määrää ja siitä aiheutuvia yleiskustannuksia kaikkien näiden tietojen käsittelyyn. Varmuuskopioita tehtäessä on usein irtisanomisia ja varmuuskopioiden välillä on vain pieniä muutoksia. Irtisanomisten valossa kapasiteetin optimointistrategioissa kehitetään ratkaisuja, jotka pienentävät tallennuskustannuksia ja varmuuskopioiden kokoa pienennettyjä jopa 95 prosenttia. Kapasiteetin optimointi tunnetaan toisinaan kaistanleveyden optimointina, kun sitä käytetään laajakaistaverkko (WAN) -sovelluksessa, jotta saadaan suurempi suorituskyky lähetettäessä ja vastaanotettaessa tietoja verkossa.

Tiedonpakkauksessa käytetään yleensä koodaustekniikoita tallennettavan tai lähetettävän datan koon pienentämiseksi. Riippuen siitä, hylätäänkö joitain tietoja prosessissa, ne voidaan luonnehtia häviöllisiksi – menettävät tiedot – tai häviöttömiksi. Tietojen skannaaminen irtisanomisten tai toistojen varalta ja niiden korvaaminen ristiviittauksilla ja indeksoiduilla tunnuksilla mahdollistaa tarvittavan tallennustilan pienentämisen suuresti. Tiedonsiirtokoodikirjat ohjaavat tiedonsiirron kiihdyttäjiä synkronoimaan ja käyttämään joko muistia tai kiintolevyä pakkaushistorian kirjoittamiseen tallennusvarastoon, jolloin lähetyksen ohjausprotokollan (TCP) välityspalvelinta voidaan käyttää pakettien tai istuntojen puskurina, jotta lähetysnopeudet eivät muutu vähennetty. Toinen tietojen pakkausmenetelmä pienentää tietojen kokoa reaaliajassa ensimmäisen varmuuskopioinnin yhteydessä ja siten edelleen optimoimalla, mikä säästää sekä tilaa että aikaa.

Perinteisten pakkausmenetelmien käyttäminen voi pienentää tallennettujen tietojen kokoa suhteessa 2: 1; kapasiteetin optimoinnin avulla tämä vähennys voi kasvaa jopa 20: 1. Reduktioiden etsiminen tavusekvensseissä eri vertailuikkunoissa ja salauksen hajautustoimintojen käyttäminen ainutlaatuisille sekvensseille deduplikoinnin algoritmeissa mahdollistaa datavirtojen segmentoinnin. Näille stream -segmenteille annetaan sitten yksilölliset tunnisteet ja indeksoidaan hakua varten. Tällä tavalla vain uudet tietojoukot tallennetaan ennen pakkaamista edelleen käyttämällä pakkausstandardialgoritmeja. Jotkin deduplikointimenetelmät ovat laitteistopohjaisia, ja niiden yhdistäminen perinteisiin ohjelmiston pakkausalgoritmeihin mahdollistaa molempien toimintojen huomattavan tilan- ja ajan säästämisen.

Monissa lähestymistavoissa keskitytään kustannusten ja tallennuskapasiteetin vähentämiseen, jotta voidaan vähentää varastointiinfrastruktuuriin liittyviä kustannuksia, ja vastaavia näkökohtia ilmenee WAN -skenaarioissa. Sovellusten ja alla olevien verkkorakenteiden välissä on oltava siirtokerroksena tunnettu kerros lähetysten aikana, jotta tiedot voidaan lähettää ja vastaanottaa tehokkaasti ja nopeasti, mutta siirtokerros on edelleen se, joka luotiin vuonna 1981, kun TCP luotiin ja ajettiin 300 baudilla korko. Siksi kiihdyttimet käyttävät TCP -välityspalvelimia, vähentävät häviöitä lähetyksen aikana ja tekevät kuittauksia pakettien koon kasvattamiseksi käyttämällä kehittyneitä datanpakkausmenetelmiä, jotta saadaan enemmän tietoa aikasegmenttiä kohti. Välittääkseen esteet lähetyksen aikana nämä tekniikat toimivat yhtenäisesti parantaakseen sovellusten suorituskykyä ja vähentääkseen kaistanleveyden kulutusta.