Mikä on pysäytyssana?

Laskennassa ja online -sovelluksissa pysäytyssana on sana, joka suodatetaan pois tietyntyyppisen tekstin käsittelyn aikana, kuten esimerkiksi verkkohaun aloittamisen aikana. Luonnollisen kielen käsittelyn tai NLP: n yhtenä osana tunnettu tämän tyyppisen suodatuksen idea on nopeuttaa hakuja jättämällä pyynnöstä pois yleiset puheartikkelit. Sen sijaan hakukone käyttää yksinkertaista merkintää sanan läsnäolon merkitsemiseen tekstimerkkijonossa, mutta ei estä merkkiä sisällyttämästä kyseistä sivua hakutuloksiin.

Yksi tapa ymmärtää, kuinka pysäytyssanat voivat monimutkaista hakukoneiden toimintaa, on ottaa huomioon se tosiseikka, että hakiessaan hakukone ottaa huomioon kaikki sanat, jotka sisältyvät käyttäjän lähettämään hakupyyntöön. Osana tätä seikkaa moottori etsii sivuja, jotka sisältävät jokaisen sanan. Tämä tarkoittaa sitä, että jos hakupyyntö sisältää kolme sanaa, moottori tekee kolme Internet -pyyhkäisyä ja antaa etusijalle sivut, jotka sisältävät kaikki kolme sanaa.

Esimerkiksi haku, kuten “talo kukkulalla”, edellyttäisi moottorin tekevän hakuja jokaisesta sanasta järjestyksessä, ja jotkut jopa suorittivat haun pysäytyssanalla “the” kahdesti. Tämä vie aikaa ja resursseja, jotka voidaan ohjata auttamaan muita avainsanahakuja, joita muut loppukäyttäjät parhaillaan suorittavat. Käyttämällä merkkejä korvaamaan “ja” ja “päällä” haun aikana, moottori voi käyttää vähemmän resursseja ja silti palauttaa tuloksia, jotka todennäköisesti täyttävät loppukäyttäjän.

Vaikka pysäytyssanaa kutsutaan joskus myrkkysanaksi, ei todellakaan ole mitään erityisen väärää sisällyttää puheartikkeleita teksteihin, joita käytetään hakujen tekemiseen. Pysäytyssanan tai sanojen käyttö osana hakupyyntöä voi vaikeuttaa hakukoneiden indeksointia, kun yritetään hakea tietoja, jotka täyttävät hakukriteerit. Loppukäyttäjä ei kuitenkaan todennäköisesti näe paljon eroa lopullisesti palautettavassa tiedon poimimisessa.

Ei ole kovaa ja nopeaa pysäytyssanaluetteloa, jota kaikki hakukoneet käyttävät yleisesti. Itse asiassa jotkin hakukoneet eivät käytä lainkaan minkäänlaista pysäytyssanaluetteloa osana luonnollisen kielen käsittelytehtävää. Muut moottorit käyttävät kuitenkin runsaasti pysäytyssanaluetteloa keinona kohdentaa resursseja tehokkaammin ja palauttavat silti hakukoneen tulokset, jotka ovat tarkkoja ja todennäköisesti erittäin sopivia tiettyä tiettyä käyttäjää käyttäville hakupyynnöille moottori.