Verkon kerääminen on prosessi, jolla erikoistunut ohjelmisto kerää tietoja Internetistä ja sijoittaa ne tiedostoihin loppukäyttäjälle. Se toimii samankaltaisena, mutta kehittyneempänä kuin hakukoneen suorittamat tehtävät. Verkon kerääminen, joka tunnetaan myös nimellä Web -kaavinta, antaa käyttäjälle automaattisen pääsyn Internetissä oleviin tietoihin, joita hakukoneet eivät voi käsitellä, koska ne voivat kiertää HTML -koodia. Kolme päätyyppiä Web -keräyksestä ovat verkkosisällön, rakenteen ja käytön kannalta.
Verkkosisällön kerääminen sisältää tietojen talteenottoa keräämällä tietoja sekä hakusivun tuloksista että Web -sivuihin piilotetun sisällön syvemmästä etsinnästä. Nämä lisätiedot on usein peitetty hakukoneilta, koska HTML -koodi peittää ne. Prosessi skannaa tietoja, jotka ovat samankaltaisia kuin ihmisen silmät, ja hylkää merkkejä, jotka eivät muodosta merkityksellisiä lauseita hyödyllisten elementtien poimimiseksi.
Sisällön etsimisen sijaan Web -rakenteen kerääminen kerää tietoja siitä, miten tiedot on järjestetty tietyille Internet -alueille. Kerätyt tiedot tarjoavat arvokasta palautetta, josta voidaan tehdä parannuksia esimerkiksi tietojen järjestämisessä ja haussa. Se on tapa hioa Web -rakennetta.
Verkkokäytön kerääminen seuraa yleisiä käyttötapoja ja web -käyttäjien mukautettua käyttöä. Verkkokäyttöä analysoimalla kerääminen voi auttaa selkeyttämään käyttäjien käyttäytymistä. Tämä on toinen tapa parantaa verkon toimintaa, mutta loppukäyttäjän tasolla. Se voi auttaa suunnittelijoita parantamaan verkkosivustojensa käyttöliittymiä maksimaalisen tehokkuuden saavuttamiseksi. Prosessi tarjoaa myös tietoa siitä, millaista tietoa käyttäjät etsivät ja miten he löytävät sen, ja antaa siten käsityksen siitä, miten sisältöä tulisi kehittää jatkossa.
Keräämällä teksti- ja kuvatietoja HTML -tiedostoista ja kuvista, Web -keräys voi suorittaa monimutkaisemman Web -indeksoinnin, joka syventyy jokaiseen asiakirjaan. Se analysoi myös linkit, jotka viittaavat kyseiseen sisältöön määrittääkseen, onko tiedolla merkitystä ja merkitystä Internetissä. Tämä antaa täydellisemmän kuvan siitä, miten tiedot liittyvät muuhun Webiin ja vaikuttavat siihen.
Yritykset käyttävät Web -keräystä moniin eri tarkoituksiin. Se voi olla tehokas tapa kerätä tietoja analysoitavaksi. Jotkut yleisimmistä kerätyistä tietojoukoista ovat tietoja kilpailijoista, luettelot eri tuotteiden hinnoista ja taloudelliset tiedot. Tietoja voidaan kerätä myös asiakkaiden käyttäytymisen analysoimiseksi.