Mitä ovat tilastollisesti epätodennäköiset lauseet?

Tilastollisesti epätodennäköiset lauseet eli SIP -hakutekniikka, jonka Amazon.com on kehittänyt etsimään kirjojen sisällöstä sellaisia ​​ilmauksia, jotka ovat todennäköisesti ainutlaatuisia tai esiintyvät usein. Tämä on osa Amazonin patentoitua Search Inside! ® -teknologiaohjelmaa. Pohjimmiltaan Search Inside® antaa Amazonille pääsyn kirjan osittaiseen tai täydelliseen tekstiin, jotta tiettyjä lauseita voidaan käyttää kirjan tunnistamiseen, jos haussa käytetään tilastollisesti epätodennäköisiä lauseita.

Tämän tekniikan nimi on hieman hämmentävä. Kun teet haun, haluat etsimäsi vastaavan tarkasti. Tunnistamalla kirjan ainutlaatuisen lauseen, jos käytät sitä lauseen etsimiseen, on epätodennäköistä, että hakusi luettelee jotain, mitä et halua. Jos etsit tiettyä kirjaa, mutta et muista sen nimeä, mutta muistat lainauksen siitä, voit käyttää kirjaa lainauksella.

Vaihtoehtoisesti voit etsiä tiettyä aihetta laajemmasta aiheesta. Jos esimerkiksi haluat etsiä kirjaa, jossa on ura -neuvoja, mutta mitä todella halusit lukea siitä, miten verkostoitua työpaikkoja varten, voit etsiä “verkostoitumista” “uraneuvonnan” sijaan. Jotkut olennaisimmat haut näkyvät heti Amazon -hakutulossivulla, mukaan lukien kirjat, kuten Dig Your Well Before You Thirsty: the Only Networking Book You Ever Need.

Jos olet hakenut tämän tyyppisiä tilastollisesti epätodennäköisiä lauseita, saatat huomata, että saat tuloksia, jotka eivät ole täsmälleen sopivia. Esimerkiksi verkostoitumisen ensimmäinen hakutulos ei ole uraverkosto, vaan tietokone- ja teknologiaverkotiedot. Voit tehdä parempia tilastollisesti epätodennäköisiä lauseita olemalla tarkempia. Esimerkiksi saat parempia tuloksia etsimällä ura- tai työverkostoista.

Tilastollisesti epätodennäköiset lauseet ovat itse asiassa todennäköisiä lauseita, koska se on todennäköisesti Search Inside! ® -kirjan ainutlaatuinen lause, joka johtaa etsimiesi asioiden luetteloa. Voit esimerkiksi kirjoittaa Shakespearen rivin Shakespearen sonetista tuodaksesi esiin Shakespearen kirjoja. Tämä ei aina toimi hyvin, koska joitakin hyvin tunnettuja lainauksia käytetään monissa muissa kirjoissa nimikkeinä. Et löydä Hamletia, jos haet “olla tai olla olematta”. Et myöskään löydä Macbethiä tilastollisesti epätodennäköisillä lauseilla, kuten ”Out! Helvetin paikka. ” Itse asiassa tämän jälkimmäisen termin alla ensimmäinen kirja, jonka löydät, on tahranpoisto.

Tilastollisesti epätodennäköisten lauseiden käyttäminen on myös tapa etsiä verkkosisältöä, ja indeksointirobotit voivat käyttää samanlaista tekniikkaa, jotta ihmiset voivat etsiä tehokkaimmin ja tarkemmin tiettyjä ainutlaatuisia rivejä. Se ei ole täydellinen tekniikka, koska indeksointirobotti ei välttämättä arvioi sisältöä. Se voi etsiä avainsanan toistoa, jonka avulla ihmiset voivat löytää palasia, joilla on enemmän avainsanojen toistoja. Kaikissa Amazonin kirjoissa ei ole Search Inside! ® -tekniikkaa, mutta tämä näyttää olevan trendi. Vaikka järjestelmä olisi hieman epätäydellinen, se voisi lyhentää hakuaikaa.