Mikä on näytön kaavin?

Näytön kaavin on tietokoneohjelma, joka kerää merkkipohjaisia ​​tietoja toisen ohjelman näyttölähdöstä. Näytön kaapimet voivat poimia etsimänsä tiedot ja esittää ne rikkaammassa muodossa, kuten kaavioina tai taulukoina, tai yksinkertaisesti indeksoida tiedot tallennusta varten. Näytön kaapimelle on monia muita nimiä, mukaan lukien Web -sivuston kaavin, sisällönkaivuri, Web -sivuston ripperi, web -poimija, automaattinen tiedonkeruulaite ja HTML -kaavin.

Näytön kaavin etsii verkkosivuston koodin läpi ja suodattaa pois ylimääräisen koodin, joka tarjoaa mukavan esityksen loppuselaimelle. Tällainen koodi on tarpeen koko sivun katsomiseksi sille suunnitellussa asettelussa, mutta kaavin etsii vain hyödyllistä tietoa. Nämä tiedot kerätään ja esitetään yksinkertaisena tietokantana ilman kelloja ja pillejä alkuperäisessä HTML -koodissa.

Hyvä esimerkki näytön kaavimesta toiminnassa on hakukoneiden hämähäkit. Nämä hämähäkit käyttävät satoja tuhansia verkkosivustoja, joista jokainen sisältää lukuisia sivuja. Näiden sivustojen avainsanatiedot kerätään ja indeksoidaan ja esitetään lopulta loppukäyttäjälle hakukoneen tuloksina.

Useimmat näytön kaapimet pyyhkäisevät verkkosivuston HTML -koodausta saadakseen tietoja, mutta he voivat myös etsiä muita skriptikieliä, kuten JavaScript tai PHP. Kaivostetut tiedot voidaan sitten esittää itse HTML -muodossa, jotta käyttäjä voi käyttää niitä verkkoselaimellaan, tai tallentaa tekstidatana, johon käyttäjä voi käyttää offline -tilassa.

Yritykset käyttävät näytön kaapimia eri avainsanoihin liittyvien verkkosivustojen tietojen louhimiseen kaavioiden, kaavioiden, laskentataulukoiden ja vertailutietojen luomiseksi raporteissa ja esityksissä. Näytön kaavin säästää poikkeuksellisen paljon aikaa, koska samaa tehtävää tekevän työntekijän on etsittävä asiaankuuluvia sivustoja, napsautettava linkkejä ja selattava kutakin sivustoa erikseen löytääkseen ja tallentaakseen tarvitsemansa tiedot. Näytön kaavinta voidaan käyttää myös silloin, kun tietoja on tallennettu järjestelmään, johon ei voi enää päästä, koska se on yhteensopivuusongelmia uudempien laitteiden tai ohjelmistojen kanssa.

Näytön kaapimet voivat olla sekä siunaus että kirous sivustojen omistajille ja selailijoille. Vaikka ne tarjoavat ehdottomasti toimivan palvelun yrityksille, hakukoneille ja muille, näytön kaavinta voidaan käyttää myös vähemmän kuin altruistisiin tarkoituksiin. Esimerkiksi roskapostia mainontamenetelmänä käyttävät yritykset tai yksityishenkilöt voivat käyttää näytön kaavinta kaivamaan sähköpostiosoitteita verkkosivustoilta.
Vaikka näytön kaavin voi olla kätevä työkalu, verkkoyhteisössä on jonkin verran keskustelua laillisuudesta ja etiikasta, kun niitä käytetään. Tekijänoikeusongelmat hämärtyvät, kun näytön kaavin poimii jonkun kovan työn ja esittelee sen toisessa muodossa toiselle verkkosivustolle, ja niillä sivustoilla, jotka ovat riippuvaisia ​​mainonnasta tuoton tuottamiseksi, on ongelmia, kun näytön kaavin hylkää heidän mainoksensa. Tämän seurauksena jotkut verkkosivustojen omistajat ovat alkaneet ottaa käyttöön työkaluja, jotka estävät heidän sivustojensa kaapimisen.