Miten hakukoneet toimivat?

Hakukoneet ovat pohjimmiltaan tietokonealgoritmeja, jotka auttavat käyttäjiä löytämään etsimänsä tiedot. Erilaiset toimivat eri tavoin, mutta ne kaikki käyttävät samoja perusperiaatteita.

Ensimmäinen asia, jonka hakukoneiden on tehtävä toimiakseen, on luoda paikallinen tietokanta pohjimmiltaan Internetistä. Varhaiset versiot vain indeksoivat avainsanoja ja sivujen otsikoita, mutta nykyiset sisältävät kaiken tekstin jokaisella sivulla sekä paljon muuta tietoa sivun suhteesta muihin sivuihin ja joissakin tapauksissa koko median tai osan siitä löytyy myös sivulta. Hakukoneiden on indeksoitava kaikki nämä tiedot, jotta ne voivat suorittaa hakuja tehokkaasti sen sijaan, että heidän pitäisi ajaa ympäri Internetiä joka kerta, kun hakulauseke lähetetään.

Hakukoneet luovat nämä tietokannat suorittamalla säännöllisiä Internet -indeksointeja. Varhaiset versiot vaativat usein sivujen lähettämistä heille, jotta ne voisivat indeksoida, mutta nyt useimmat sivut löytyvät muiden sivujen linkkien kautta. Mitä kutsutaan roboteiksi tai hämähäkkeiksi, tietokoneohjelmat, jotka on rakennettu indeksoimaan sivuja, heilumaan sivulta toiselle, tallentamaan kaikki sivun tiedot ja seuraamaan jokaista linkkiä uusille sivuille. Eri hakukoneet päivittävät hakemistojaan eri aikaväleillä sen mukaan, kuinka monta hämähäkkiä heillä on jatkuvasti indeksointia ja kuinka nopeasti nämä hämähäkit indeksoivat. Jotkut toimivat Internetin välityksellä joka päivä tai kaksi ja toiset päivittävät vain säännöllisesti joka viikko tai kuukausi.

Kun hämähäkki käy läpi nämä sivut, se tallentaa sivuille löytämänsä sanat. Se tekee muistiinpanoja siitä, kuinka monta kertaa jokainen sana esiintyy, painotetaanko sanoja tietyllä tavalla, ehkä koon, sijainnin tai HTML -merkinnän perusteella, ja päättää, kuinka osuvat sanat ovat sivulle tulevien linkkien perusteella, ja sivun yleisessä kontekstissa.

Hakukoneiden on sitten painotettava kunkin sivun arvo ja jokaisen sivun arvo siinä näkyvien sanojen osalta. Tämä on vaikein osa, mutta myös tärkein. Yksinkertaisimmalla tasolla se voisi yksinkertaisesti seurata sivun jokaista sanaa ja tallentaa sivun osuvaksi hauilla, joilla on kyseinen avainsana. Tämä ei kuitenkaan hyödyttäisi useimpia käyttäjiä, koska haluttu sivu on hakulausekkeen kannalta osuvin. Joten eri moottorit keksivät erilaisia ​​tapoja painottaa tärkeyttä.

Eri hakukoneiden käyttämät algoritmit ovat hyvin suojattuja, jotta ihmiset eivät voi luoda sivuja parempien sijoitusten saamiseksi tai ainakin rajoittaa sitä, missä määrin he voivat tehdä sen. Tämä ero johtuu siitä, että eri moottorit tuottavat erilaisia ​​tuloksia samoilla ehdoilla. Google saattaa määrittää, että yksi sivu on paras tulos hakutermille, ja Ask saattaa määrittää, että sama sivu ei ole edes 50 parhaan joukossa. Tämä kaikki perustuu vain siihen, miten he arvostavat saapuvia ja lähteviä linkkejä, ja avainsanojen tiheyttä. pitää tärkeänä, kuinka he arvostavat sanojen eri sijoittelua ja mitä tahansa pienempiä tekijöitä.
Hakukoneiden uusin suuntaus ja todennäköisesti haun tulevaisuus yleensä on siirtyä pois avainsanapohjaisista hauista käsitepohjaisiin hakuihin. Tässä uudessa hakuvaihtoehdossa ohjelma ei rajoita hakua vain hakijan syöttämiin avainsanoihin, vaan se yrittää selvittää, mitä nämä avainsanat tarkoittavat, jotta se voi ehdottaa sivuja, jotka eivät ehkä sisällä tarkkaa sanaa, mutta ovat kuitenkin ajankohtaisia Hae. Tämä on vielä kehittyvä ala, mutta toistaiseksi näyttää siltä, ​​että sillä on paljon mahdollisuuksia tehdä hauista osuvampia, mikä tekee verkosta entistä helpomman paikan löytää juuri etsimäsi.