Mikä on tiedostojen pakkaus?

Tiedostojen pakkaus on tietokoneiden menetelmä pienentää sähköisen tiedoston tai tiedostoryhmän koko pienimpään mahdolliseen kokoon. ZIP -tiedostot ovat yleinen esimerkki tiedostojen pakkaamisesta. Tietokoneohjelmat käyttävät monia tekniikoita tiedostojen pakkaamiseen, mutta yleisin tapa on korvata toistuvat jaksot pienemmillä jaksoilla. Tietokoneet tekevät tämän luetteloimalla ensimmäisen esiintymän ja viittaamalla siihen myöhemmin. Esimerkiksi tätä edeltävissä lauseissa kirjaimet “pakkaa” ovat ilmestyneet kolme kertaa. Tietokone saattaa pakata ne luetteloimalla ensimmäisen esiintymän ja yhdistämällä kaikki seuraavat esiintymät “& cmp” -merkintään, mikä vähentää tarvittavien kirjainten tai merkkien määrää ja pienentää tiedoston kokoa. Suuren tiedoston aikana tällainen korvaaminen voi säästää paljon tilaa. On kuitenkin huomattava, että käyttäjä ei näe tätä – tietokone tekee kaiken työn taustalla.

Tietokoneohjelmat luovat myös sanakirjan pakatulle tiedostolle seuratakseen lyhennettyjä korvauksia. Tiedostojen pakkausmaailmassa sanakirja on luettelo alkuperäisistä lauseista ja niiden korvauksista. Tämä sanakirja sisältyy kuitenkin tiedostokokoon, joten se myös vie tilaa, mikä vähentää pakkauksella säästettävää tilaa. Tästä syystä yksittäisen pienen tiedoston pakkaaminen on yleensä vähemmän tehokasta kuin suuri tiedosto tai ryhmä.

Tiedostojen pakkausohjelmat toimivat hieman eri tavoin. Nämä erot johtuvat enimmäkseen algoritmista. Algoritmi on matemaattinen rakenne, joka etsii tiedostoista toistoja ja laittaa yksinkertaiset viitteet. Ohjelmoijat luovat pakkausalgoritmit ja määrittävät pakkauksessa käytettävät mallit ja korvaukset. Variaatiot voivat vaikuttaa pakkauksen tehokkuuteen. Esimerkiksi lauseessa “se oli parasta aikaa, se oli pahinta aikaa” toistetaan jaksot “se oli” ja “aikojen aika”. Ohjelmoija voi halutessaan korvata jokaisen koko lauseen tai ehkä korvata “sen” yksitellen ja “kertaa” erikseen. Nämä pienet erot algoritmeissa ovat syitä, miksi jotkut tiedostojen pakkausohjelmat toimivat paremmin joissakin tiedostotyypeissä kuin toiset.

Jotkin pakatut tiedostotyypit purkautuvat itse, eli ne avautuvat automaattisesti, kun käyttäjä napsauttaa niitä-niiden purkamiseen ei tarvita ulkoisia ohjelmia. Näiden tiedostojen luomiseksi alkuperäisen pakkausohjelman on lisättävä pakattuun tiedostoon lisäkoodia. Tästä syystä itsepurkautuva pakattu tiedosto on usein suurempi kuin sama tiedosto, jos se pakattaisiin normaalisti. Tätä pidetään tyypillisesti hyvänä kompromissina yrityksille, jotka julkaisevat ohjelmia asennettavaksi kotitietokoneisiin. Tekemällä tiedoston itsepurkautuvaksi se sallii kotikäyttäjän ohittaa askeleen ja lisää todennäköisyyttä, että ohjelmisto asennetaan. Voit purkaa tiedostoja, jotka eivät ole itsepurkautuvia, lataamalla Internetistä useita kolmannen osapuolen ohjelmia.